Essa pesquisa aborda o esquecimento na IA por meio do aprendizado contínuo na compreensão da linguagem falada.
― 9 min ler
Ciência de ponta explicada de forma simples
Essa pesquisa aborda o esquecimento na IA por meio do aprendizado contínuo na compreensão da linguagem falada.
― 9 min ler
O novo modelo ZET-Speech melhora a síntese de fala emocional para oradores diversos.
― 6 min ler
Estudo descobre que novas técnicas de mixagem melhoram a precisão da transcrição musical.
― 5 min ler
Um novo método melhora as respostas das máquinas através de uma melhor compreensão emocional.
― 7 min ler
Um novo método melhora a precisão no reconhecimento automático de voz em reuniões.
― 6 min ler
O CALLS tem como objetivo melhorar a capacidade dos assistentes de voz em lidar com interações com os clientes.
― 5 min ler
Novos métodos melhoram a restauração de áudio e a qualidade de produção.
― 6 min ler
A pesquisa melhora as técnicas de quantização pra aumentar a eficiência dos modelos de reconhecimento de fala.
― 9 min ler
A PLCMOS oferece um jeito novo de avaliar a qualidade do som sem ouvintes humanos.
― 7 min ler
LoopBoxes ajuda as crianças a fazer música de um jeito fácil e colaborativo.
― 7 min ler
Um novo método pra criar sons de impacto realistas usando redes neurais.
― 5 min ler
Nova técnica melhora sistemas de ASR para reconhecer melhor sotaques não nativos.
― 7 min ler
Novos métodos aproveitam a identidade do falante pra melhorar o desempenho do reconhecimento de fala.
― 5 min ler
Um novo método combina reconhecimento de fala e identificação de falantes para fala sobreposta.
― 6 min ler
Um novo método melhora a qualidade e a eficiência da tradução em tempo real.
― 5 min ler
Uma nova abordagem melhora o aprendizado de máquina com menos exemplos e dados multimodais.
― 6 min ler
Um novo método para estimar as respostas de sala em ambientes sonoros complexos.
― 7 min ler
Um novo método de conversão de voz melhora a clareza e a adaptação.
― 7 min ler
Construindo sistemas de TTS para línguas turcas menos conhecidas usando dados do cazaque.
― 6 min ler
MeLoDy gera rapidamente música de alta qualidade a partir de prompts de texto.
― 6 min ler
Novos métodos estão surgindo para proteger o reconhecimento de voz contra ataques adversariais.
― 6 min ler
AudioDec oferece áudio de alta qualidade em tempo real com baixo consumo de dados.
― 6 min ler
Uma técnica nova verifica a exposição dos dados de treino em modelos de difusão.
― 6 min ler
Um novo modelo melhora a isolação de voz em ambientes barulhentos.
― 6 min ler
Esse artigo fala sobre como recriar o som de fita magnética usando tecnologia digital.
― 7 min ler
Novo framework melhora a qualidade da geração de voz na síntese de fala.
― 5 min ler
Pesquisadores desenvolvem tecnologia pra recriar vozes únicas pra quem tem dificuldades de fala.
― 6 min ler
Um novo método melhora a verificação de locutores ao combinar destilação de conhecimento e ajuste fino.
― 8 min ler
DeCoR ajuda as máquinas a aprender novos sons sem esquecer os antigos.
― 6 min ler
Transformadores de áudio em streaming melhoram a velocidade e a eficiência nos sistemas de tagueamento de áudio.
― 7 min ler
Novas técnicas melhoram a precisão e a velocidade na conversão de fala em texto.
― 6 min ler
Essa pesquisa apresenta avaliações melhoradas para uma comunicação mais clara em pessoas com disartria.
― 6 min ler
Um novo método melhora o reconhecimento de voz para nomes que soam parecidos.
― 6 min ler
Um novo método melhora a naturalidade e a variedade da saída de texto para fala.
― 6 min ler
O adaptador Treff melhora a classificação de áudio com dados rotulados limitados.
― 6 min ler
Novos métodos melhoram a flexibilidade e o desempenho do modelo em tarefas de áudio.
― 5 min ler
Pesquisas mostram métodos eficazes pra reconhecer emoções na fala usando embeddings.
― 6 min ler
Descubra como os E-PANNs melhoram a eficiência do reconhecimento de som.
― 6 min ler
Essa pesquisa analisa dialetos usando gravações de áudio pra mostrar as semelhanças entre eles.
― 6 min ler
Novo método melhora a compreensão da linguagem falada sem precisar de transcrições escritas.
― 6 min ler