Reborn oferece soluções inovadoras para reconhecimento automático de fala sem dados rotulados.
― 7 min ler
Ciência de ponta explicada de forma simples
Reborn oferece soluções inovadoras para reconhecimento automático de fala sem dados rotulados.
― 7 min ler
Uma nova estrutura melhora os modelos de linguagem ao reconhecer e responder a diferentes estilos de fala.
― 8 min ler
Um novo sistema pra avaliar o desempenho de codec de áudio em várias aplicações.
― 8 min ler
Um novo modelo pra avaliar modelos de fundação em tarefas de fala.
― 9 min ler
Uma nova ferramenta pra avaliar a melhoria contínua dos modelos de linguagem através do feedback.
― 7 min ler
Novos métodos melhoram o reconhecimento de fala em ambientes barulhentos usando técnicas adaptativas.
― 8 min ler
Um novo método melhora o diálogo da máquina através de dados pseudo-estéreo.
― 7 min ler
DogeRM junta modelos gerais e específicos pra dar um up na performance dos modelos de linguagem.
― 6 min ler
Um novo framework melhora a performance de ASR usando dados e recursos limitados.
― 6 min ler
Analisando como os codecs mantêm os tons emocionais nos dados de voz.
― 6 min ler
Este artigo analisa como a assistência ao usuário pode melhorar o desempenho de modelos de linguagem grandes na geração de consultas SQL.
― 6 min ler
Esse artigo analisa como a geração estruturada afeta o raciocínio e a compreensão dos modelos de linguagem.
― 6 min ler
Um novo conjunto de dados destaca os preconceitos em modelos de fala baseados em gênero e idade.
― 8 min ler
Pesquisas mostram como os neurônios em modelos de fala reconhecem características-chave do som.
― 8 min ler
Esse artigo fala sobre métodos de treinamento eficientes para modelos de fala usando aprendizado auto-supervisionado.
― 5 min ler
Este estudo melhora os sistemas de reconhecimento de emoções para línguas menos comuns usando dados de alta qualidade.
― 7 min ler
Esse estudo avalia quão bem os LLMs entendem os tropos narrativos em resumos de filmes.
― 4 min ler
Um olhar sobre os resultados do desafio Codec-SUPERB e as métricas de desempenho do codec.
― 6 min ler
Novo método para modelos de linguagem falada reduz a necessidade de dados extensivos.
― 7 min ler
Explore como o Align-SLM tá mudando a geração de fala em computadores.
― 7 min ler
Criando um modelo de IA pra conversas naturais em mandarim taiwanês.
― 5 min ler
Um guia pra aprender uma nova língua de forma eficaz com dicas práticas.
― 6 min ler
Novos métodos melhoram como as máquinas reconhecem a linguagem falada.
― 9 min ler
Novos métodos melhoram os sistemas de ASR para línguas que eles nunca tinham encontrado antes.
― 8 min ler
Um novo método combina modelos pra melhorar a segurança e o desempenho.
― 6 min ler