O novo modelo ZET-Speech melhora a síntese de fala emocional para oradores diversos.
― 6 min ler
Ciência de ponta explicada de forma simples
O novo modelo ZET-Speech melhora a síntese de fala emocional para oradores diversos.
― 6 min ler
Estudo descobre que novas técnicas de mixagem melhoram a precisão da transcrição musical.
― 5 min ler
Um novo método melhora as respostas das máquinas através de uma melhor compreensão emocional.
― 7 min ler
Um novo método melhora a precisão no reconhecimento automático de voz em reuniões.
― 6 min ler
O CALLS tem como objetivo melhorar a capacidade dos assistentes de voz em lidar com interações com os clientes.
― 5 min ler
Novos métodos melhoram a restauração de áudio e a qualidade de produção.
― 6 min ler
A PLCMOS oferece um jeito novo de avaliar a qualidade do som sem ouvintes humanos.
― 7 min ler
LoopBoxes ajuda as crianças a fazer música de um jeito fácil e colaborativo.
― 7 min ler
Um novo método pra criar sons de impacto realistas usando redes neurais.
― 5 min ler
Nova técnica melhora sistemas de ASR para reconhecer melhor sotaques não nativos.
― 7 min ler
Novos métodos aproveitam a identidade do falante pra melhorar o desempenho do reconhecimento de fala.
― 5 min ler
Um novo método combina reconhecimento de fala e identificação de falantes para fala sobreposta.
― 6 min ler
Um novo método melhora a qualidade e a eficiência da tradução em tempo real.
― 5 min ler
Um novo método para estimar as respostas de sala em ambientes sonoros complexos.
― 7 min ler
Um novo método de conversão de voz melhora a clareza e a adaptação.
― 7 min ler
MeLoDy gera rapidamente música de alta qualidade a partir de prompts de texto.
― 6 min ler
Novos métodos estão surgindo para proteger o reconhecimento de voz contra ataques adversariais.
― 6 min ler
Uma técnica nova verifica a exposição dos dados de treino em modelos de difusão.
― 6 min ler
Um novo modelo melhora a isolação de voz em ambientes barulhentos.
― 6 min ler
Esse artigo fala sobre como recriar o som de fita magnética usando tecnologia digital.
― 7 min ler
Um novo método melhora a verificação de locutores ao combinar destilação de conhecimento e ajuste fino.
― 8 min ler
DeCoR ajuda as máquinas a aprender novos sons sem esquecer os antigos.
― 6 min ler
Transformadores de áudio em streaming melhoram a velocidade e a eficiência nos sistemas de tagueamento de áudio.
― 7 min ler
Novas técnicas melhoram a precisão e a velocidade na conversão de fala em texto.
― 6 min ler
Essa pesquisa apresenta avaliações melhoradas para uma comunicação mais clara em pessoas com disartria.
― 6 min ler
Um novo método melhora o reconhecimento de voz para nomes que soam parecidos.
― 6 min ler
Um novo método melhora a naturalidade e a variedade da saída de texto para fala.
― 6 min ler
O adaptador Treff melhora a classificação de áudio com dados rotulados limitados.
― 6 min ler
Novos métodos melhoram a flexibilidade e o desempenho do modelo em tarefas de áudio.
― 5 min ler
Descubra como os E-PANNs melhoram a eficiência do reconhecimento de som.
― 6 min ler
Essa pesquisa analisa dialetos usando gravações de áudio pra mostrar as semelhanças entre eles.
― 6 min ler
Um novo método melhora a classificação de áudio aprendendo sons novos de forma eficiente.
― 5 min ler
Novo método melhora a adaptação de TTS com requisitos mínimos de dados.
― 6 min ler
Uma visão geral dos métodos de IA explicável em reconhecimento automático de fala.
― 7 min ler
Um novo modelo melhora como as máquinas entendem e respondem a perguntas em áudio.
― 6 min ler
Pesquisas mostram que precisa melhorar a troca de turno na tecnologia de TTS.
― 7 min ler
Um novo método melhora a seleção de fala sintética para aumentar a precisão dos sistemas de reconhecimento de fala.
― 7 min ler
Um novo método alinha fala com gagueira com texto de forma eficiente.
― 6 min ler
Melhorando sistemas de reconhecimento de fala silenciosa com novas técnicas.
― 6 min ler
Novos métodos melhoram o reconhecimento automático de fala para palavras raras usando contexto.
― 7 min ler