Hung-yi Lee

Computação e linguagem Resolvendo a Confusão de Nomes na Geração de Texto

Novo método melhora a verificação de fatos para textos gerados por computador com nomes ambíguos.

2025-09-09T17:30:48+00:00 ― 8 min ler

Processamento de Áudio e Fala Apresentando o AV-SUPERB: Um Novo Padrão para Modelos Audiovisuais

AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.

2025-09-08T22:32:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Renascido: Uma Nova Era em ASR Não Supervisionado

Reborn oferece soluções inovadoras para reconhecimento automático de fala sem dados rotulados.

2025-08-25T19:16:10+00:00 ― 7 min ler

Computação e linguagem Avançando Modelos de Linguagem Através de Estilos de Fala

Uma nova estrutura melhora os modelos de linguagem ao reconhecer e responder a diferentes estilos de fala.

2025-08-23T00:03:45+00:00 ― 8 min ler

Processamento de Áudio e Fala Codec-SUPERB: Um Benchmark para Codecs de Som

Um novo sistema pra avaliar o desempenho de codec de áudio em várias aplicações.

2025-08-22T23:15:10+00:00 ― 8 min ler

Processamento de Áudio e Fala Avaliação de Modelos de Processamento de Fala com o SUPERB

Um novo modelo pra avaliar modelos de fundação em tarefas de fala.

2025-08-11T09:31:05+00:00 ― 9 min ler

Computação e linguagem StreamBench: Avaliando Modelos de Linguagem em Tempo Real

Uma nova ferramenta pra avaliar a melhoria contínua dos modelos de linguagem através do feedback.

2025-07-30T03:52:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços em Reconhecimento Automático de Fala com TTA Dinâmico

Novos métodos melhoram o reconhecimento de fala em ambientes barulhentos usando técnicas adaptativas.

2025-07-29T13:49:25+00:00 ― 8 min ler

Computação e linguagem Avanços em Sistemas de Diálogo Falado

Um novo método melhora o diálogo da máquina através de dados pseudo-estéreo.

2025-07-25T08:36:30+00:00 ― 7 min ler

Computação e linguagem Melhorando Modelos de Linguagem com o Framework DogeRM

DogeRM junta modelos gerais e específicos pra dar um up na performance dos modelos de linguagem.

2025-07-21T17:22:18+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando ASR de Code-Switching com Destilação de Conhecimento

Um novo framework melhora a performance de ASR usando dados e recursos limitados.

2025-07-15T22:41:45+00:00 ― 6 min ler

Processamento de Áudio e Fala Codecs de Fala e Preservação Emocional

Analisando como os codecs mantêm os tons emocionais nos dados de voz.

2025-07-12T06:26:10+00:00 ― 6 min ler

Computação e linguagem Aprimorando LLMs: O Papel do Suporte ao Usuário em Consultas SQL

Este artigo analisa como a assistência ao usuário pode melhorar o desempenho de modelos de linguagem grandes na geração de consultas SQL.

2025-07-09T18:04:30+00:00 ― 6 min ler

Computação e linguagem Impacto das Restrições de Formato no Desempenho de LLM

Esse artigo analisa como a geração estruturada afeta o raciocínio e a compreensão dos modelos de linguagem.

2025-07-02T00:09:42+00:00 ― 6 min ler

Computação e linguagem Avaliando o Viés em Modelos de Linguagem de Fala

Um novo conjunto de dados destaca os preconceitos em modelos de fala baseados em gênero e idade.

2025-06-30T19:07:50+00:00 ― 8 min ler

Processamento de Áudio e Fala Insights sobre Neurônios em Modelos de Fala

Pesquisas mostram como os neurônios em modelos de fala reconhecem características-chave do som.

2025-06-17T11:17:25+00:00 ― 8 min ler

Processamento de Áudio e Fala Treinamento Eficiente de Modelos de Fala com Recursos Limitados

Esse artigo fala sobre métodos de treinamento eficientes para modelos de fala usando aprendizado auto-supervisionado.

2025-06-16T15:02:50+00:00 ― 5 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Emoções em Línguas de Baixo Recurso

Este estudo melhora os sistemas de reconhecimento de emoções para línguas menos comuns usando dados de alta qualidade.

2025-06-08T07:51:20+00:00 ― 7 min ler

Computação e linguagem Avaliando as Habilidades dos LLMs em Raciocínio Narrativo

Esse estudo avalia quão bem os LLMs entendem os tropos narrativos em resumos de filmes.

2025-06-07T23:11:54+00:00 ― 4 min ler

Processamento de Áudio e Fala Avaliação de Codecs de Áudio Neural: Insights do Desafio Codec-SUPERB

Um olhar sobre os resultados do desafio Codec-SUPERB e as métricas de desempenho do codec.

2025-06-05T06:58:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços em Modelos de Linguagem de Fala Sem Precisar de Muitos Dados de Treinamento

Novo método para modelos de linguagem falada reduz a necessidade de dados extensivos.

2025-05-29T17:50:26+00:00 ― 7 min ler

Computação e linguagem Avanços em Modelos de Linguagem de Fala

Explore como o Align-SLM tá mudando a geração de fala em computadores.

2025-05-25T12:16:30+00:00 ― 7 min ler

Computação e linguagem Construindo um Chatbot para Conversas em Mandarim Taiwanês

Criando um modelo de IA pra conversas naturais em mandarim taiwanês.

2025-05-20T03:51:26+00:00 ― 5 min ler

Som Passos Simples para Aprender um Novo Idioma

Um guia pra aprender uma nova língua de forma eficaz com dicas práticas.

2025-04-21T06:21:36+00:00 ― 6 min ler

Som Avanços em Reconhecimento Automático de Fala

Novos métodos melhoram como as máquinas reconhecem a linguagem falada.

2025-04-20T10:37:12+00:00 ― 9 min ler

Processamento de Áudio e Fala Avanços em Reconhecimento Automático de Fala para Línguas Não Vistas

Novos métodos melhoram os sistemas de ASR para línguas que eles nunca tinham encontrado antes.

2025-02-05T19:53:24+00:00 ― 8 min ler

Computação e linguagem Mantendo Modelos de Linguagem Grande Seguros e Eficazes

Um novo método combina modelos pra melhorar a segurança e o desempenho.

2025-01-22T06:45:27+00:00 ― 6 min ler