O corpus JNV captura sons emocionais diversos em japonês, enriquecendo as coleções existentes.
― 7 min ler
Ciência de ponta explicada de forma simples
O corpus JNV captura sons emocionais diversos em japonês, enriquecendo as coleções existentes.
― 7 min ler
Novos métodos melhoram a geração de risadas para interações mais reais entre humanos e computadores.
― 6 min ler
Um olhar sobre como identificar áudio falso no mundo tecnológico de hoje.
― 5 min ler
Um novo método melhora a detecção de emoções na fala através de técnicas avançadas de transformadores.
― 6 min ler
Usando modelos de texto pra melhorar a geração de fala e facilitar a compreensão.
― 9 min ler
O C-MCR simplifica a aprendizagem multimodal conectando o conhecimento já existente de forma eficiente.
― 7 min ler
FluentSpeech oferece uma solução automática para editar falas de forma mais tranquila.
― 8 min ler
A MDA melhora o reconhecimento de fala otimizando modelos para áreas de dados específicas.
― 6 min ler
Pesquisas mostram que sinais do cérebro podem ajudar a prever os movimentos da língua durante a fala.
― 7 min ler
O sistema U-DiT TTS melhora a geração de fala natural com uma arquitetura inovadora.
― 5 min ler
Um novo método busca melhorar os sistemas de ASR para pessoas com disartria.
― 6 min ler
Melhorando a identificação de falantes ao combinar som e palavras faladas em áudio.
― 6 min ler
Agentes virtuais aprendem a imitar gestos humanos pra interagir melhor.
― 7 min ler
Um novo método pra criar sintetizadores que beneficia os músicos.
― 7 min ler
Um novo modelo melhora a detecção de falantes ativos usando pistas de áudio e visuais.
― 6 min ler
Uma olhada nos desafios e defesas em sistemas de verificação automática de fala.
― 5 min ler
Redes ópticas permitem transferências de dados rápidas, moldando o futuro da tecnologia de comunicação.
― 6 min ler
Um novo método melhora os modelos de áudio geral para reconhecimento de fala eficaz.
― 8 min ler
Novo modelo melhora a compreensão emocional em diálogos.
― 8 min ler
Um modelo combina linguagem falada e texto pra melhorar a precisão da tradução.
― 6 min ler
A pesquisa usa modelos de fala humana pra analisar as vocalizações dos marmosets de forma eficaz.
― 7 min ler
Novos métodos melhoram a detecção precoce de doenças respiratórias usando dados sonoros.
― 6 min ler
Esse estudo analisa como o riso transmite emoções através da análise do som.
― 5 min ler
Um novo modelo traz recursos de voz para dispositivos sem internet.
― 6 min ler
O novo modelo ZET-Speech melhora a síntese de fala emocional para oradores diversos.
― 6 min ler
Estudo descobre que novas técnicas de mixagem melhoram a precisão da transcrição musical.
― 5 min ler
Um novo método melhora as respostas das máquinas através de uma melhor compreensão emocional.
― 7 min ler
Um novo método melhora a precisão no reconhecimento automático de voz em reuniões.
― 6 min ler
O CALLS tem como objetivo melhorar a capacidade dos assistentes de voz em lidar com interações com os clientes.
― 5 min ler
Novos métodos melhoram a restauração de áudio e a qualidade de produção.
― 6 min ler
A PLCMOS oferece um jeito novo de avaliar a qualidade do som sem ouvintes humanos.
― 7 min ler
LoopBoxes ajuda as crianças a fazer música de um jeito fácil e colaborativo.
― 7 min ler
Um novo método pra criar sons de impacto realistas usando redes neurais.
― 5 min ler
Nova técnica melhora sistemas de ASR para reconhecer melhor sotaques não nativos.
― 7 min ler
Novos métodos aproveitam a identidade do falante pra melhorar o desempenho do reconhecimento de fala.
― 5 min ler
Um novo método combina reconhecimento de fala e identificação de falantes para fala sobreposta.
― 6 min ler
Um novo método melhora a qualidade e a eficiência da tradução em tempo real.
― 5 min ler
Um novo método para estimar as respostas de sala em ambientes sonoros complexos.
― 7 min ler
Um novo método de conversão de voz melhora a clareza e a adaptação.
― 7 min ler
MeLoDy gera rapidamente música de alta qualidade a partir de prompts de texto.
― 6 min ler