Um novo método melhora a classificação de áudio aprendendo sons novos de forma eficiente.
― 5 min ler
Ciência de ponta explicada de forma simples
Um novo método melhora a classificação de áudio aprendendo sons novos de forma eficiente.
― 5 min ler
Novo método melhora a adaptação de TTS com requisitos mínimos de dados.
― 6 min ler
Uma visão geral dos métodos de IA explicável em reconhecimento automático de fala.
― 7 min ler
Um novo modelo melhora como as máquinas entendem e respondem a perguntas em áudio.
― 6 min ler
Pesquisas mostram que precisa melhorar a troca de turno na tecnologia de TTS.
― 7 min ler
O BabySLM avalia como as máquinas aprendem a entender a fala com base na linguagem das crianças.
― 8 min ler
Um novo método melhora a seleção de fala sintética para aumentar a precisão dos sistemas de reconhecimento de fala.
― 7 min ler
Um novo método alinha fala com gagueira com texto de forma eficiente.
― 6 min ler
Melhorando sistemas de reconhecimento de fala silenciosa com novas técnicas.
― 6 min ler
Novos métodos melhoram o reconhecimento automático de fala para palavras raras usando contexto.
― 7 min ler
Um novo método para treinar modelos de detecção de palavras-chave usando supervisão fraca em ambientes barulhentos.
― 7 min ler
Métodos pra melhorar sistemas de tradução de fala pra línguas sub-representadas.
― 5 min ler
MERT enfrenta os desafios de modelagem musical com técnicas de aprendizado auto-supervisionado inovadoras.
― 7 min ler
Uma nova abordagem melhora o desempenho do RNN-T no reconhecimento automático de fala.
― 8 min ler
O modelo AVLIT combina som e vídeo pra melhorar a clareza da fala em lugares barulhentos.
― 6 min ler
Analisando o impacto de dados tendenciosos em tecnologias de detecção de áudio.
― 7 min ler
Um novo método melhora a separação de vozes usando vários microfones sem dados rotulados.
― 4 min ler
Um estudo melhora os modelos de verificação de fala pra proteger melhor a identidade.
― 7 min ler
Novos modelos melhoram a forma como as máquinas respondem a perguntas baseadas em áudio.
― 5 min ler
A pesquisa quer melhorar a detecção de idiomas em conversas entre inglês e mandarim.
― 9 min ler
Novos métodos melhoram a síntese de fala para o suíço-alemão a partir de texto em alemão padrão.
― 6 min ler
Explorando métodos para melhorar o reconhecimento de fala multilíngue em línguas indianas.
― 7 min ler
Descubra como o SVVAD melhora a detecção de atividade de voz pra uma verificação de falante melhor.
― 6 min ler
Um novo método melhora o feedback de pronúncia para quem aprende línguas.
― 7 min ler
Um novo modelo avalia como os modelos de fala se adaptam a tarefas específicas.
― 7 min ler
A pesquisa melhora a tradução de fala multilíngue usando conhecimento semântico.
― 5 min ler
Modelos HuBERT melhoram tarefas de fala usando múltiplas resoluções pra ter um desempenho melhor.
― 6 min ler
Novas técnicas melhoram a precisão em reconhecer falantes e detectar impostores.
― 5 min ler
Uma nova abordagem melhora a resposta de fase em efeitos de áudio virtuais usando deep learning.
― 6 min ler
SlothSpeech mostra fraquezas nos sistemas de reconhecimento de voz, deixando eles bem mais lentos.
― 5 min ler
UnDiff melhora a qualidade do áudio usando técnicas inovadoras de restauração de fala.
― 7 min ler
Pesquisadores analisam como o GSLM processa a fala em ambientes barulhentos.
― 7 min ler
Novos métodos em aprendizado de máquina melhoram as capacidades de detecção de gagueira.
― 6 min ler
EmoMix permite criar falas que expressam emoções mistas com intensidade certa.
― 6 min ler
Descubra o método inovador de Autoencoder Máscara de Múltiplas Janelas para aprimorar o processamento de áudio.
― 6 min ler
Um método novo combina dados de áudio e visuais pra consertar fala que tá faltando.
― 7 min ler
Explorando métodos para detectar discurso de ódio em transmissões de áudio de línguas com poucos recursos.
― 5 min ler
Um novo método restaura as altas frequências perdidas em gravações históricas.
― 8 min ler
Um novo método melhora os sistemas de reconhecimento de fala automático pra mais precisão e adaptabilidade.
― 7 min ler
Um novo modelo melhora a difração de som em ambientes virtuais.
― 8 min ler