Pesquisadores melhoram a detecção de fala gerada por máquinas usando ajustes nas informações de fase.
― 6 min ler
Ciência de ponta explicada de forma simples
Pesquisadores melhoram a detecção de fala gerada por máquinas usando ajustes nas informações de fase.
― 6 min ler
Um novo framework melhora o estudo de sistemas de reconhecimento de fala não supervisionados.
― 8 min ler
Novo modelo LinDiff melhora a velocidade e a qualidade da síntese de fala.
― 5 min ler
Pesquisadores misturam recursos visuais e sonoros pra melhorar a fala de quem usa eletrólitos.
― 6 min ler
Essa pesquisa mostra como LLMs melhoram a compreensão da fala em vídeos longos.
― 5 min ler
Um novo método otimiza modelos de fala pra melhor desempenho com menos recursos.
― 6 min ler
O EM-Network melhora o aprendizado de sequências em tarefas de processamento de fala e língua.
― 6 min ler
Este estudo avalia vários modelos para prever a qualidade da fala sintetizada.
― 6 min ler
Esse artigo fala sobre como melhorar o reconhecimento de fala usando métodos de ensemble baseados em confiança.
― 6 min ler
O GenerTTS melhora a tecnologia de texto-para-fala para aplicativos multilíngues.
― 6 min ler
Um novo modelo melhora a extração de fala de fundos barulhentos usando aprendizado profundo.
― 5 min ler
Um estudo sobre como melhorar a reprodução do som vocal usando técnicas de síntese avançadas.
― 6 min ler
Novos métodos buscam esconder a identidade dos falantes mantendo a clareza na fala.
― 6 min ler
Um novo método pra melhorar a qualidade do áudio usando redes eficientes em energia.
― 6 min ler
Pesquisadores analisam como as emoções são compartilhadas pela fala usando dados diversos.
― 7 min ler
Novos métodos melhoram a qualidade da fala sintetizada usando aprendizado auto-supervisionado.
― 6 min ler
Aprendizado Federado melhora o reconhecimento de fala enquanto mantém os dados dos usuários privados.
― 6 min ler
Um novo método melhora a detecção de emoções na fala usando só áudio.
― 5 min ler
O-1 melhora o reconhecimento de fala otimizando métodos de auto-treinamento.
― 6 min ler
A pesquisa destaca métodos de detecção em tempo real para áudios falsos criados por IA.
― 6 min ler
Novos métodos de poda melhoram o desempenho de modelos de texto-para-fala de múltiplos falantes em zero-shot.
― 8 min ler
Novos métodos para selecionar dados de fala minimizam a rotulagem enquanto melhoram a precisão do reconhecimento.
― 6 min ler
Um novo método melhora a classificação da qualidade de fala usando as notas de preferência dos ouvintes.
― 6 min ler
Um método pra melhorar os sistemas de reconhecimento de voz pra usuários que gaguejam.
― 6 min ler
Novos métodos de um único passo melhoram a precisão no acompanhamento de formantes para sons de fala.
― 5 min ler
Uma nova abordagem melhora a integração da fala com modelos de linguagem.
― 7 min ler
Analisando como modelos de linguagem pré-treinados melhoram a qualidade do texto-para-fala.
― 6 min ler
O MuLanTTS da Microsoft oferece capacidades de texto-para-fala em francês de forma natural e expressiva.
― 5 min ler
Um projeto tem como objetivo melhorar o processamento de fala em francês usando aprendizado auto-supervisionado.
― 6 min ler
Novos métodos melhoram como as máquinas reconhecem o ritmo da fala e a emoção.
― 7 min ler
Esse estudo melhora a capacidade dos sistemas de ASR em reconhecer a fala das crianças.
― 7 min ler
VoxtLM combina reconhecimento de fala, síntese, geração de texto e continuação em um só modelo.
― 5 min ler
A Libriheavy oferece 50.000 horas de inglês falado pra melhorar a tecnologia de reconhecimento de fala.
― 6 min ler
O AV2Wav melhora a qualidade da fala usando dicas sonoras e visuais.
― 6 min ler
A seleção de core-set melhora os modelos de texto-para-fala ao focar em dados diversos.
― 6 min ler
Novo método preserva o tom emocional na conversão de voz pra uma melhor interação humano-computador.
― 6 min ler
Pesquisas mostram que a fala emocional afeta o desempenho do modelo em tarefas de separação de fala.
― 7 min ler
A pesquisa combina aprendizado auto-supervisionado e novas técnicas de medição pra melhorar a inversão de fala.
― 6 min ler
Pesquisadores desenvolvem uma nova estrutura pra melhorar a clareza da fala pra usuários de eletrolaringe.
― 6 min ler
Um novo método usa dados sintéticos pra melhorar sistemas de ASR em áreas desconhecidas.
― 7 min ler