Um novo modelo melhora o reconhecimento de voz e se adapta a várias tarefas de fala.
― 5 min ler
Ciência de ponta explicada de forma simples
Um novo modelo melhora o reconhecimento de voz e se adapta a várias tarefas de fala.
― 5 min ler
Uma nova abordagem melhora a detecção de gravações de áudio falsas.
― 6 min ler
Apresentando o NanoVoice, um modelo de texto para fala rápido e eficiente para áudio personalizado.
― 6 min ler
Um novo sistema melhora a identificação dos falantes durante discussões com vários participantes.
― 6 min ler
Uma nova abordagem para melhorar a classificação através da Perda de Distribuição de Distância Angular.
― 7 min ler
Novos métodos usando modelos de linguagem melhoram a detecção de som em meio ao barulho de fundo.
― 7 min ler
Saiba como o TSE melhora o reconhecimento de fala em ambientes cheios usando dicas de texto.
― 6 min ler
Nova abordagem melhora a avaliação da qualidade de fala ao considerar o ruído de fundo.
― 7 min ler
Uma olhada em como a compressão de faixa dinâmica melhora as experiências de áudio.
― 6 min ler
Um novo modelo melhora a identificação e localização de sons de forma eficaz.
― 8 min ler
Apresentando o VQalAttent, um modelo mais simples pra gerar fala de máquina realista.
― 6 min ler
Pesquisadores melhoram a detecção de fala pra buscas por voz mais rápidas e precisas.
― 6 min ler
Explorando como truques de áudio confundem modelos de linguagem.
― 7 min ler
Descubra como os CAMs estão mudando a forma como produzimos e vivenciamos música.
― 7 min ler
A Noro melhora a conversão de voz, tornando-a eficaz até em ambientes barulhentos.
― 7 min ler
Combinar modelos de imagem com sistemas de áudio aumenta a eficiência e o desempenho.
― 8 min ler
Descubra como a separação de fontes musicais e a transcrição mudam a forma como vivemos a música.
― 7 min ler
Novos métodos ajudam as máquinas a encontrar informações importantes a partir de conteúdo falado.
― 6 min ler
Novos modelos identificam fala sintética e combatem o uso indevido da tecnologia de voz.
― 6 min ler
Saiba como o SpeechRAG melhora a resposta a perguntas em áudio sem erros de ASR.
― 6 min ler
A tecnologia de melhoria de áudio se adapta pra reduzir barulho e melhorar a comunicação.
― 5 min ler
Explorando como a língua afeta a precisão na detecção de DeepFake em várias línguas.
― 7 min ler
Um modelo leve projetado pra separar fala misturada em ambientes barulhentos.
― 6 min ler
Pesquisadores enfrentam a falsificação de áudio pra melhorar a segurança do reconhecimento de voz.
― 10 min ler