Um guia pra fazer trabalhos acadêmicos claros e eficazes.
― 4 min ler
Ciência de ponta explicada de forma simples
Um guia pra fazer trabalhos acadêmicos claros e eficazes.
― 4 min ler
Examinando os riscos de ataques via backdoor em sistemas de verificação de voz.
― 8 min ler
Um novo método melhora a segmentação áudio-visual sem precisar de rótulos detalhados.
― 6 min ler
A PIAVE ajuda máquinas a captar vozes com clareza, mesmo quando as pessoas viram a cabeça.
― 7 min ler
A Libriheavy oferece 50.000 horas de inglês falado pra melhorar a tecnologia de reconhecimento de fala.
― 6 min ler
O AV2Wav melhora a qualidade da fala usando dicas sonoras e visuais.
― 6 min ler
Um jeito novo de as máquinas mudarem emoções na fala de forma natural.
― 6 min ler
Novos métodos estão sendo desenvolvidos pra identificar vozes cantando deepfake na indústria da música.
― 7 min ler
A seleção de core-set melhora os modelos de texto-para-fala ao focar em dados diversos.
― 6 min ler
Novos modelos estão mudando a forma como analisamos emoções na fala.
― 7 min ler
Um novo método usa ultrassom para reconhecer ações enquanto protege a privacidade.
― 6 min ler
Apresentando uma estrutura flexível para aprimorar a pesquisa em privacidade de voz.
― 8 min ler
CiwaGAN combina o controle dos movimentos da fala e o compartilhamento de informações pra aprender a falar melhor.
― 7 min ler
Uma estrutura que mistura pistas verbais e não verbais pra melhorar o aprendizado de línguas.
― 7 min ler
Um novo método facilita a compreensão dos modelos de classificação de fala.
― 7 min ler
Um novo sistema melhora as habilidades de pronúncia levando em conta as influências da língua materna.
― 6 min ler
Descubra como ferramentas quânticas mudam a criação e a performance musical.
― 7 min ler
Novo método melhora a preservação de emoções em processos de conversão de voz.
― 6 min ler
Novo método preserva o tom emocional na conversão de voz pra uma melhor interação humano-computador.
― 6 min ler
Novos sistemas melhoram a tradução de texto para fala sem intermediários.
― 5 min ler
Pesquisadores melhoram a precisão da classificação de sons cardíacos usando métodos de aumento de dados por codec.
― 7 min ler
Pesquisas mostram que a fala emocional afeta o desempenho do modelo em tarefas de separação de fala.
― 7 min ler
M-AUDIODEC comprime áudio multicanal mantendo a posição dos alto-falantes e a qualidade.
― 7 min ler
Novos métodos em S2ST melhoram a qualidade da tradução mantendo a identidade do falante.
― 6 min ler
Um novo sistema melhora a compressão de áudio espacial para um som mais claro e eficiente.
― 5 min ler
Um novo sistema que liga música e linguagem pra entender melhor.
― 7 min ler
Pesquisas revelam novos modelos para melhorar a clareza da voz em fones de ouvido inteligentes.
― 6 min ler
Usar informações extras melhora nossa capacidade de identificar os cantos dos pássaros.
― 7 min ler
Uma nova abordagem melhora a geração de áudio ao alinhar o áudio com as descrições em texto.
― 6 min ler
Pesquisadores trabalham pra melhorar o reconhecimento de fala online usando modelos de espaço de estado estruturados.
― 6 min ler
Um novo sistema melhora as experiências de reunião identificando os falantes em tempo real.
― 5 min ler
Novos métodos estão melhorando nossa habilidade de detectar discursos falsos de forma eficaz.
― 6 min ler
Um método de conversão de voz que melhora a privacidade e a qualidade da fala.
― 8 min ler
Novos métodos melhoram a capacidade de distinguir áudio falso do verdadeiro.
― 6 min ler
Um método melhora a detecção de vozes sintéticas e identifica seus criadores.
― 6 min ler
Novos métodos melhoram modelos pequenos pra uma melhor melhoria de voz usando menos recursos.
― 6 min ler
Um novo método melhora os modelos de ASR para usuários individuais usando quantização e adaptação.
― 7 min ler
Novos métodos melhoram o desempenho de vocoder com dados de áudio limitados.
― 6 min ler
Um olhar sobre a disartria, como detectá-la e o papel da tecnologia.
― 6 min ler
Promptes suaves melhoram a tecnologia de reconhecimento de fala para um desempenho melhor em ambientes barulhentos.
― 6 min ler