A pesquisa explora o potencial do BERT na análise musical em nível de bares.
― 6 min ler
Ciência de ponta explicada de forma simples
A pesquisa explora o potencial do BERT na análise musical em nível de bares.
― 6 min ler
Artigos mais recentes
Artigos mais recentes
Uma nova abordagem melhora a identificação de linguagem falada usando aprendizado auto-supervisionado e rótulos.
― 7 min ler
Um novo método melhora o reconhecimento de fala para falantes árabes com disartria.
― 6 min ler
Allophant melhora o reconhecimento de fonemas para línguas com poucos dados.
― 6 min ler
Apresentando SANGEET, um dataset super detalhado sobre Música Clássica Hindustani.
― 5 min ler
Um novo método busca melhorar a detecção de áudio falso sem perder o conhecimento anterior.
― 7 min ler
Um novo framework melhora o estudo de sistemas de reconhecimento de fala não supervisionados.
― 8 min ler
Esse projeto ajuda qualquer um a compor música usando batidas básicas e métodos avançados de computador.
― 5 min ler
Modelos auto-supervisionados revelam insights sobre distinções fônicas e fonêmicas na fala.
― 6 min ler
A pesquisa investiga o uso de reconhecimento de voz na análise de filmagens de câmeras corporais da polícia.
― 7 min ler
Uma olhada em como os computadores estão mudando a composição musical.
― 5 min ler
Novas técnicas melhoram a compreensão emocional em tarefas de processamento de fala.
― 7 min ler
Novo modelo LinDiff melhora a velocidade e a qualidade da síntese de fala.
― 5 min ler
Uma nova abordagem pra compressão de áudio reduz o tamanho do arquivo sem perder qualidade.
― 6 min ler
Técnicas pra melhorar o reconhecimento de voz com barulho de fundo.
― 7 min ler
HiddenSinger melhora a qualidade da voz cantada usando técnicas avançadas de IA.
― 6 min ler
Novos métodos melhoram a clareza da fala para usuários de eletrólito.
― 7 min ler
Pesquisadores misturam recursos visuais e sonoros pra melhorar a fala de quem usa eletrólitos.
― 6 min ler
Um estudo mostra como o envelhecimento afeta o desempenho da verificação de fala automática.
― 6 min ler
PauseSpeech melhora sistemas TTS com uma fala mais natural através de pausas melhores.
― 6 min ler
Essa pesquisa apresenta um sistema pra combinar música com conteúdo de vídeo de forma eficaz.
― 8 min ler
Novos métodos melhoram o desempenho do reconhecimento de fala automático em meio ao barulho de fundo.
― 7 min ler
Um novo método otimiza modelos de fala pra melhor desempenho com menos recursos.
― 6 min ler
Uma nova abordagem melhora como avaliamos a qualidade do áudio espacial.
― 6 min ler
Um estudo sobre como diferenciar fala lida e fala espontânea.
― 6 min ler
Um novo modelo aumenta o realismo da fala sintética.
― 9 min ler
Um novo modelo melhora a precisão e a eficiência no rastreamento de fontes sonoras.
― 6 min ler
Um novo conjunto de dados melhora a compreensão da linguagem falada em italiano.
― 7 min ler
Novos métodos melhoram o reconhecimento de fala multilíngue usando fontes de dados existentes.
― 8 min ler
A pesquisa foca em melhorar a tecnologia de fala para idiomas que não têm dados suficientes.
― 7 min ler
Um olhar sobre os desenvolvimentos recentes em melhorar a clareza do áudio usando modelos avançados.
― 6 min ler
Um novo conjunto de dados tem como objetivo classificar partituras de piano por nível de dificuldade.
― 8 min ler
O framework Gesper melhora a clareza da fala em ambientes barulhentos.
― 5 min ler
Este estudo apresenta um novo método para melhorar a qualidade do áudio usando modelos pré-treinados.
― 6 min ler
Combinar áudio, vídeo e texto melhora a detecção de discurso de ódio.
― 6 min ler
Esse artigo fala sobre um novo método pra construir sistemas de ASR eficientes.
― 5 min ler
Um novo método usando Redes Neurais Gráficas melhora a análise de Números Romanos na música.
― 7 min ler
Equipes melhoram a identificação de sons de animais com poucos exemplos no desafio DCASE.
― 6 min ler
Saiba mais sobre sistemas de etiquetagem de áudio e como usá-los no Raspberry Pi.
― 5 min ler
Novas técnicas melhoram a precisão e a eficiência na identificação de músicas cover.
― 6 min ler
Novo método melhora o controle de ruído em espaços 3D.
― 5 min ler