Um novo método melhora a precisão na localização sonora enquanto garante a privacidade dos dados.
― 5 min ler
Ciência de ponta explicada de forma simples
Um novo método melhora a precisão na localização sonora enquanto garante a privacidade dos dados.
― 5 min ler
O SoloAudio melhora a extração de som usando técnicas avançadas e dados sintéticos.
― 6 min ler
O OpenACE oferece um bom padrão para avaliar codecs de áudio em várias condições.
― 6 min ler
Um método pra identificar falhas em motores elétricos através da análise de som e redes neurais bayesianas.
― 6 min ler
Modelos de reconhecimento de fala estão evoluindo com previsão de múltiplos tokens para respostas mais rápidas.
― 6 min ler
Esforços pra melhorar a tecnologia de fala pro idioma Faetar, que é pouco recursos.
― 6 min ler
Um novo método zero-shot melhora a precisão da conversão de voz e minimiza o vazamento de som.
― 6 min ler
Estudo revela como os tons mudam na fala do mandarim taiwanês do dia a dia.
― 5 min ler
Nova abordagem melhora a isolação de voz em configurações de áudio misto usando tokens discretos.
― 6 min ler
Pesquisa liga pinturas à música interpretando emoções.
― 7 min ler
Um novo método melhora a detecção automática de problemas de fala relacionados à doença de Parkinson.
― 5 min ler
Uma nova abordagem melhora os sistemas de ASR pra uma comunicação melhor na sala de aula.
― 6 min ler
Este artigo explora como entradas variadas podem aumentar a precisão do reconhecimento de fala.
― 6 min ler
Um sistema que facilita a criação de música e deixa todo mundo, independentemente do nível de habilidade, conseguir fazer.
― 8 min ler
O ReCLAP melhora a classificação de áudio com prompts detalhados pra uma precisão melhor.
― 6 min ler
Um projeto tem como objetivo melhorar a tecnologia de fala para quem tem dificuldades de comunicação.
― 6 min ler
MambaFoley revoluciona a síntese de som Foley com um tempo e realismo melhorados.
― 6 min ler
Um novo sistema melhora a precisão do sotaque em TTS pra uma comunicação melhor.
― 6 min ler
Usar embeddings CLAP melhora muito os sistemas de recomendação de música.
― 8 min ler
Estudo explora o desenvolvimento de ASR para Amis e Seediq, focando no uso de dados.
― 8 min ler
Pesquisadores desenvolvem novas estratégias pra distinguir animais individuais usando os sons únicos deles.
― 6 min ler
Um novo método simplifica a detecção de sirenes pra aumentar a segurança dos veículos.
― 6 min ler
Uma nova abordagem combina a detecção de eventos sonoros e a diarização de fala pra uma melhor compreensão do áudio.
― 6 min ler
Uma nova abordagem melhora a ASR ao focar em detalhes específicos do falante.
― 6 min ler
Um estudo mostrando como modelos de deep learning reconhecem emoções na fala.
― 5 min ler
Uma ferramenta fácil de usar pra ajustar modelos de fala sem precisar de código complicado.
― 7 min ler
Novos métodos melhoram o isolamento acústico de ambientes barulhentos sem precisar de dados rotulados.
― 6 min ler
Uma nova abordagem enfrenta a variação de canal em sistemas de reconhecimento de voz.
― 6 min ler
Um novo método melhora o reconhecimento de voz de máquinas para verificação de falantes.
― 7 min ler
Um novo modelo melhora a geração de áudio usando textos e sons detalhados.
― 7 min ler
A inteligência artificial tá mudando a música com novas ferramentas e jeitos de fazer.
― 7 min ler
MaskSR2 melhora a clareza e a qualidade do áudio usando técnicas inovadoras.
― 6 min ler
Um novo método para gerar fala com acento usando transliteração de texto.
― 7 min ler
E1 TTS transforma texto em fala natural de forma mais rápida e eficiente.
― 6 min ler
Wave-U-Mamba melhora gravações de fala de baixa qualidade pra uma comunicação mais clara.
― 5 min ler
Um novo sistema prevê notas de naturalidade para a fala sintética usando métodos inovadores.
― 7 min ler
Um novo método usa áudio pra melhorar a precisão na pronúncia das máquinas.
― 6 min ler
Novos métodos melhoram a sincronização de áudio com cenas de vídeo que mudam.
― 5 min ler
Explorando o desafio GenSEC pra melhorar a precisão da transcrição de voz.
― 5 min ler
Um novo método de avaliação para esquizofrenia usando dados multimodais.
― 6 min ler