A SecureSpectra oferece uma nova maneira de proteger a identidade auditiva contra ameaças de deepfake.
― 6 min ler
Ciência de ponta explicada de forma simples
A SecureSpectra oferece uma nova maneira de proteger a identidade auditiva contra ameaças de deepfake.
― 6 min ler
Combinando física e geometria pra melhorar as previsões de dispersão acústica.
― 6 min ler
Um novo sistema pra tradução de fala precisa e rápida em várias línguas.
― 7 min ler
Um método simples pra criar vozes e controlar emoções na síntese de fala.
― 6 min ler
Melhorando o MMDenseNet pra separar música de forma rápida e eficiente.
― 6 min ler
Uma nova abordagem pra melhorar a clareza do som usando técnicas avançadas de deep learning.
― 8 min ler
Um sistema combina áudio e vídeo pra melhorar a precisão na detecção de falantes.
― 6 min ler
Um novo método melhora o diálogo da máquina através de dados pseudo-estéreo.
― 7 min ler
Este estudo apresenta um conjunto de dados e um método pra melhorar a precisão do ASR chinês usando Pinyin.
― 8 min ler
Técnicas inovadoras melhoram o design de alto-falantes e a direção do som.
― 5 min ler
Um novo modelo combina dados de áudio e visuais pra uma melhor compreensão.
― 6 min ler
Este estudo foca em melhorar a detecção de áudio deepfake usando métodos avançados.
― 5 min ler
Usando interfaces visuais e modelos pra melhorar a geração de música.
― 6 min ler
Um novo esquema pra criar efeitos sonoros sincronizados em vídeos.
― 7 min ler
Um estudo sobre como melhorar a segmentação de áudio integrando embeddings de falantes.
― 6 min ler
Esse artigo apresenta um sistema TTS mais eficiente que se adapta aos falantes.
― 6 min ler
Novos métodos melhoram modelos de fala para línguas com poucos dados.
― 6 min ler
Entender a incerteza aumenta a precisão do reconhecimento de emoções em situações do dia a dia.
― 7 min ler
Um novo método melhora a precisão do alinhamento de fonemas para várias aplicações de fala.
― 6 min ler
Um estudo sobre como traduzir o inglês nigeriano para melhorar a acessibilidade em filmes de Nollywood.
― 7 min ler
Este artigo apresenta um sistema de codificador duplo para um aprendizado eficaz de representação de fala.
― 7 min ler
Um sistema pra reconhecimento de falantes em áudio multilíngue sem precisar de muitos dados.
― 6 min ler
MelodyT5 oferece uma nova maneira de criar e analisar música usando notação simbólica.
― 7 min ler
O dataset GTZAN-synth usa música sintética pra melhorar os sistemas de tagueamento de música.
― 6 min ler
MelodyLM facilita a criação de música usando textos e comandos de voz.
― 7 min ler
O modelo SAVE melhora a segmentação áudio-visual com eficiência e precisão.
― 7 min ler
Novo modelo melhora a tradução de fala para texto usando grandes modelos de linguagem.
― 7 min ler
Pesquisas mostram um modelo que liga gravações de áudio aos movimentos da boca na fala.
― 7 min ler
Este artigo fala sobre como o Wav2Vec2.0 processa os sons da fala usando fonologia.
― 6 min ler
Melhorando a tecnologia de anonimização de falantes em nove idiomas pra garantir a privacidade.
― 6 min ler
Explorando o papel da tecnologia em melhorar a eficiência e o bem-estar da aquicultura.
― 6 min ler
Pesquisas mostram como o vídeo ajuda a melhorar o reconhecimento de fala em ambientes barulhentos.
― 6 min ler
Uma nova abordagem combina análise de voz com proteção de privacidade para detecção de demência.
― 7 min ler
Novos métodos melhoram a precisão na identificação dos sons dos animais para monitoramento da vida selvagem.
― 5 min ler
Novos métodos melhoram a segurança contra spoofing de voz em sistemas ASV.
― 8 min ler
Avanços na classificação de sons melhoram a precisão do reconhecimento de áudio.
― 6 min ler
Um novo método melhora a precisão em reconhecer fala de vários falantes.
― 6 min ler
O BPE acústico melhora a inteligibilidade e a qualidade da fala em sistemas TTS.
― 7 min ler
Um novo método melhora a clareza da fala em ambientes barulhentos usando redes neurais duplas.
― 5 min ler
Novo método melhora o desempenho dos sistemas de ASR com diferentes sotaques através de dicionários especializados.
― 6 min ler