Novos métodos ajudam as máquinas a encontrar informações importantes a partir de conteúdo falado.
― 6 min ler
Ciência de ponta explicada de forma simples
Novos métodos ajudam as máquinas a encontrar informações importantes a partir de conteúdo falado.
― 6 min ler
Descubra como a IA facilita a coleta de dados de fala por meio de crowdsourcing.
― 6 min ler
Explore as diferenças entre fala espontânea e fala roteirizada no processamento de áudio.
― 7 min ler
DAAN melhora como as máquinas aprendem com dados áudio-visuais em cenários zero-shot.
― 6 min ler
Novo método melhora a detecção de deepfakes de áudio usando técnicas de aprendizado inovadoras.
― 7 min ler
Um novo modelo de Cingapura melhora a compreensão da fala por máquinas.
― 8 min ler
À medida que as máquinas produzem música, precisamos proteger a criatividade humana com métodos de detecção eficazes.
― 10 min ler
Novos modelos identificam fala sintética e combatem o uso indevido da tecnologia de voz.
― 6 min ler
O TAME usa som pra detectar drones, melhorando a segurança e a monitoramento.
― 7 min ler
Descubra como o CAMEL melhora a compreensão de conversas em línguas misturadas.
― 7 min ler
Pesquisas mostram que a atividade cerebral pode ajudar as máquinas a reconhecer música de forma eficaz.
― 7 min ler
A tecnologia de áudio oferece uma maneira econômica de rastrear UAVs de forma segura.
― 7 min ler
Um novo método de IA analisa vozes pra detectar risco de câncer de laringe.
― 8 min ler
Descubra como a síntese de vídeo para áudio tá mudando as experiências de mídia com um alinhamento de som perfeito.
― 8 min ler
Um novo sistema tá revolucionando como os designers de som criam áudio pra vídeos.
― 9 min ler
Uma olhada em como o aprimoramento da fala melhora a comunicação através das características dos dados.
― 9 min ler
Novos métodos melhoram os sistemas de ASR para línguas que eles nunca tinham encontrado antes.
― 8 min ler
Descubra como a tecnologia TTA junta palavras e sons pra experiências de áudio mais ricas.
― 8 min ler
Pesquisadores melhoram o reconhecimento de fala em suíço-alemão com uma geração de dados inovadora.
― 7 min ler
Um novo método melhora a sincronia labial em vídeos dublados pra uma experiência de assistir mais natural.
― 8 min ler
Descubra como o Whisper melhora o reconhecimento de fala em conversas multilíngues.
― 5 min ler
Saiba como o SpeechRAG melhora a resposta a perguntas em áudio sem erros de ASR.
― 6 min ler
Uma abordagem nova torna o reconhecimento de sons mais acessível e eficiente.
― 8 min ler
Saiba como a anonimização de voz protege informações pessoais em um mundo movido pela tecnologia.
― 7 min ler
Unindo pistas de áudio e visuais pra melhorar o reconhecimento de fala em ambientes barulhentos.
― 6 min ler
A tecnologia de melhoria de áudio se adapta pra reduzir barulho e melhorar a comunicação.
― 5 min ler
Nova tecnologia combina som e imagens para melhorar a detecção de drones.
― 7 min ler
Uma nova abordagem combina fala e texto para fazer avaliações de disartria de forma mais eficaz.
― 6 min ler
Explorando novas tecnologias que detectam sons de fontes invisíveis.
― 6 min ler
Descubra como o Smooth-Foley aprimora a geração de áudio em vídeos.
― 6 min ler
Técnica inovadora conecta letras e melodias pra criar músicas melhores.
― 8 min ler
Aprimorando a compreensão das máquinas sobre a dinâmica de turnos de fala em diálogos humanos.
― 9 min ler
Explorando como a língua afeta a precisão na detecção de DeepFake em várias línguas.
― 7 min ler
A VERSA avalia a qualidade de fala, áudio e música de forma eficaz.
― 10 min ler
Descubra como os modelos de áudio-linguagem estão mudando a tecnologia de reconhecimento de som.
― 7 min ler
Novos métodos melhoram o diálogo natural na tecnologia de fala.
― 6 min ler
Descubra como o SpeechSSM transforma a geração de fala longa para interações melhores.
― 5 min ler
Descubra como a tradução em tempo real transforma a comunicação entre idiomas.
― 7 min ler
Um modelo leve projetado pra separar fala misturada em ambientes barulhentos.
― 6 min ler
Pesquisadores enfrentam a falsificação de áudio pra melhorar a segurança do reconhecimento de voz.
― 10 min ler