Combinando sons do coração e ecocardiografia pra melhorar o diagnóstico de doenças cardíacas congênitas.
― 7 min ler
Ciência de ponta explicada de forma simples
Combinando sons do coração e ecocardiografia pra melhorar o diagnóstico de doenças cardíacas congênitas.
― 7 min ler
Um conjunto de dados rico de gravações de guitarra ligadas a partituras pra pesquisa e análise.
― 5 min ler
Auptimize melhora a colocação de sons pra uma interação melhor do usuário em XR.
― 7 min ler
Malacopula questiona a confiabilidade das tecnologias de verificação automática de falantes.
― 7 min ler
Um novo método pra criar animações 3D de rostos mais realistas, se ajustando aos estilos de fala de cada um.
― 6 min ler
O treinamento adversarial melhora a precisão na detecção de palavras-chave em fala sintética e real.
― 6 min ler
Esse texto fala sobre aprendizado com poucos exemplos e seu impacto em tarefas de áudio.
― 8 min ler
Nova tecnologia conecta características faciais à voz, ajudando na comunicação para quem não tem voz.
― 6 min ler
Um novo método melhora a separação e geração de áudio sem dados rotulados.
― 7 min ler
Enfrentando os desafios de áudio falso e verificação de falantes.
― 6 min ler
Analisando as características da música de rage usando machine learning pra classificar melhor os gêneros.
― 6 min ler
Os clipes de áudio falsos são uma preocupação séria; métodos de detecção eficazes são essenciais.
― 7 min ler
Um novo método melhora a precisão na detecção de áudio sintético.
― 6 min ler
Um novo jeito de separar e manipular sons musicais.
― 6 min ler
O SSL-TTS simplifica a síntese de voz usando poucos dados de treino pra resultados de alta qualidade.
― 7 min ler
Novos métodos melhoram modelos de ASR para várias línguas, preservando o conhecimento passado.
― 6 min ler
Uma nova abordagem melhora o reconhecimento de frases com troca de código na fala bilíngue.
― 6 min ler
Um sistema inovador automatiza a geração de som para filmes e jogos.
― 9 min ler
Novos métodos melhoram o reconhecimento de voz em ambientes barulhentos.
― 5 min ler
Novo modelo melhora a conversão de voz, especialmente para fala sussurrada e aplicações em tempo real.
― 7 min ler
Explorando uma nova abordagem digital pra modelagem do som de amplificadores de guitarra.
― 6 min ler
Apresentando um sistema inovador pra gerar música vocal Hindustani.
― 7 min ler
Um novo método pra modelar de forma precisa compressores ópticos usando redes neurais.
― 9 min ler
O WhisperMask capta a voz direitinho em lugares barulhentos, melhorando a comunicação.
― 7 min ler
Novos métodos melhoram as avaliações da qualidade da voz para pacientes com problemas no sistema vocal.
― 7 min ler
VoiceX torna mais fácil criar vozes personalizadas para várias aplicações.
― 5 min ler
Analisando como os padrões de voz afetam o significado e o desempenho da tecnologia.
― 5 min ler
O NEST oferece uma abordagem mais rápida e eficiente para tarefas de fala auto-supervisionadas.
― 7 min ler
As referências atuais subestimam a habilidade dos modelos de conectar dados de áudio e visual.
― 6 min ler
Wav2Small melhora a detecção de emoções na fala com menos recursos.
― 5 min ler
Um olhar sobre as complicações de identificar faixas de áudio misturadas.
― 7 min ler
Uma visão geral dos ricos dialetos do tâmil e métodos de identificação.
― 6 min ler
Uma nova abordagem pra detectar problemas em máquinas sem comprometer a privacidade dos dados.
― 6 min ler
VoiceTailor transforma sistemas TTS em saídas de voz eficientes e personalizadas.
― 6 min ler
Aprenda como o som se espalha nos ambientes e suas aplicações.
― 7 min ler
O StyleSpeech melhora os sistemas de TTS pegando os detalhes naturais da fala.
― 6 min ler
Analisando métodos pra melhorar a clareza da fala em ambientes barulhentos usando deep learning.
― 7 min ler
O modelo DualSpeech melhora a clareza do TTS e a semelhança com o falante.
― 7 min ler
Apresentando o SONICS, um conjunto de dados feito pra identificar música gerada por IA com precisão.
― 10 min ler
Novos métodos melhoram a detecção de áudio falso em condições do mundo real.
― 5 min ler