Um novo método melhora a separação de vozes usando vários microfones sem dados rotulados.
― 4 min ler
Ciência de ponta explicada de forma simples
Um novo método melhora a separação de vozes usando vários microfones sem dados rotulados.
― 4 min ler
Um estudo melhora os modelos de verificação de fala pra proteger melhor a identidade.
― 7 min ler
Novos modelos melhoram a forma como as máquinas respondem a perguntas baseadas em áudio.
― 5 min ler
A pesquisa quer melhorar a detecção de idiomas em conversas entre inglês e mandarim.
― 9 min ler
Novos métodos melhoram a síntese de fala para o suíço-alemão a partir de texto em alemão padrão.
― 6 min ler
Explorando métodos para melhorar o reconhecimento de fala multilíngue em línguas indianas.
― 7 min ler
Descubra como o SVVAD melhora a detecção de atividade de voz pra uma verificação de falante melhor.
― 6 min ler
Um novo método melhora o feedback de pronúncia para quem aprende línguas.
― 7 min ler
Um novo modelo avalia como os modelos de fala se adaptam a tarefas específicas.
― 7 min ler
A pesquisa melhora a tradução de fala multilíngue usando conhecimento semântico.
― 5 min ler
Modelos HuBERT melhoram tarefas de fala usando múltiplas resoluções pra ter um desempenho melhor.
― 6 min ler
Novas técnicas melhoram a precisão em reconhecer falantes e detectar impostores.
― 5 min ler
Uma nova abordagem melhora a resposta de fase em efeitos de áudio virtuais usando deep learning.
― 6 min ler
SlothSpeech mostra fraquezas nos sistemas de reconhecimento de voz, deixando eles bem mais lentos.
― 5 min ler
UnDiff melhora a qualidade do áudio usando técnicas inovadoras de restauração de fala.
― 7 min ler
Pesquisadores analisam como o GSLM processa a fala em ambientes barulhentos.
― 7 min ler
Novos métodos em aprendizado de máquina melhoram as capacidades de detecção de gagueira.
― 6 min ler
EmoMix permite criar falas que expressam emoções mistas com intensidade certa.
― 6 min ler
Descubra o método inovador de Autoencoder Máscara de Múltiplas Janelas para aprimorar o processamento de áudio.
― 6 min ler
Um método novo combina dados de áudio e visuais pra consertar fala que tá faltando.
― 7 min ler
Explorando métodos para detectar discurso de ódio em transmissões de áudio de línguas com poucos recursos.
― 5 min ler
Um novo método restaura as altas frequências perdidas em gravações históricas.
― 8 min ler
Um novo método melhora os sistemas de reconhecimento de fala automático pra mais precisão e adaptabilidade.
― 7 min ler
Um novo modelo melhora a difração de som em ambientes virtuais.
― 8 min ler
O viés contextual melhora os sistemas de reconhecimento de fala, aumentando a precisão em tarefas específicas.
― 6 min ler
Uma nova forma de mudar as emoções na fala em meio ao barulho do dia a dia.
― 7 min ler
Esse estudo apresenta um novo sistema pra detectar erros de pronúncia em quem tá aprendendo língua.
― 7 min ler
O sistema de Q A usa aprendizado auto-supervisionado pra rearranjar músicas de um jeito inovador.
― 6 min ler
Um novo método melhora a qualidade da conversão de texto em fala e a expressão emocional.
― 5 min ler
Pesquisadores juntam dados de áudio e vídeo pra melhorar a compreensão da fala em lugares barulhentos.
― 5 min ler
Descubra como a tecnologia de controle ativo de ruído tá mudando nossa experiência sonora.
― 6 min ler
Técnicas pra diminuir o tamanho do modelo sem perder desempenho tão estão surgindo.
― 5 min ler
Novo modelo imita efeitos de fase analógicos com técnicas de aprendizado melhoradas.
― 6 min ler
Um novo modelo reduz o tamanho enquanto melhora o reconhecimento de fala em várias línguas.
― 6 min ler
Um novo método melhora a precisão do reconhecimento de fala para sotaques africanos.
― 5 min ler
Analisando o impacto de avaliações detalhadas em sistemas de síntese de fala.
― 6 min ler
Melhorando a clareza da voz com técnicas eficazes de cancelamento de eco e aprendizado de máquina.
― 8 min ler
O SingNet melhora o acompanhamento de batidas em vozes cantando usando dados anteriores.
― 7 min ler
Um novo sistema melhora o reconhecimento de fala em ambientes com várias pessoas falando.
― 7 min ler
O LipVoicer gera fala clara a partir de vídeos silenciosos usando métodos avançados de leitura labial.
― 6 min ler