Engenharia Eletrotécnica e Ciência dos Sistemas - Processamento de Áudio e Fala

RSS

Som Melhorando a Separação de Vozes com Vários Microfones

Um novo método melhora a separação de vozes usando vários microfones sem dados rotulados.

2025-10-30T15:50:50+00:00 ― 4 min ler

Som Avanços nas Técnicas de Anti-Spoofing de Áudio

Um estudo melhora os modelos de verificação de fala pra proteger melhor a identidade.

2025-10-30T15:02:15+00:00 ― 7 min ler

Computação e linguagem Avanços nos Sistemas de Perguntas e Respostas em Áudio

Novos modelos melhoram a forma como as máquinas respondem a perguntas baseadas em áudio.

2025-10-30T13:25:05+00:00 ― 5 min ler

Computação e linguagem Melhorando a Identificação de Línguas em Fala com Alternância de Código

A pesquisa quer melhorar a detecção de idiomas em conversas entre inglês e mandarim.

2025-10-30T12:36:30+00:00 ― 9 min ler

Computação e linguagem Avanços na Síntese de Fala em Alemão Suíço

Novos métodos melhoram a síntese de fala para o suíço-alemão a partir de texto em alemão padrão.

2025-10-30T10:59:20+00:00 ― 6 min ler

Computação e linguagem Avanços em Sistemas de Reconhecimento de Fala Multilíngues

Explorando métodos para melhorar o reconhecimento de fala multilíngue em línguas indianas.

2025-10-30T10:10:45+00:00 ― 7 min ler

Som Avançando a Detecção de Atividade Vocal com SVVAD

Descubra como o SVVAD melhora a detecção de atividade de voz pra uma verificação de falante melhor.

2025-10-30T09:22:10+00:00 ― 6 min ler

Som Avanços na Avaliação Automática de Pronúncia

Um novo método melhora o feedback de pronúncia para quem aprende línguas.

2025-10-30T08:33:35+00:00 ― 7 min ler

Computação e linguagem Medindo a Adaptabilidade em Modelos de Reconhecimento de Fala

Um novo modelo avalia como os modelos de fala se adaptam a tarefas específicas.

2025-10-30T06:56:25+00:00 ― 7 min ler

Computação e linguagem Avanços na Tradução de Fala Multilíngue

A pesquisa melhora a tradução de fala multilíngue usando conhecimento semântico.

2025-10-30T06:07:50+00:00 ― 5 min ler

Som Avançando o Processamento de Fala com HuBERT

Modelos HuBERT melhoram tarefas de fala usando múltiplas resoluções pra ter um desempenho melhor.

2025-10-29T22:02:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Identificação de Voz

Novas técnicas melhoram a precisão em reconhecer falantes e detectar impostores.

2025-10-29T20:24:50+00:00 ― 5 min ler

Som Melhorando Efeitos de Áudio Analógicos Virtuais com Deep Learning

Uma nova abordagem melhora a resposta de fase em efeitos de áudio virtuais usando deep learning.

2025-10-29T18:47:40+00:00 ― 6 min ler

Som Atraso no Reconhecimento de Fala: Um Olhar Mais Próximo no SlothSpeech

SlothSpeech mostra fraquezas nos sistemas de reconhecimento de voz, deixando eles bem mais lentos.

2025-10-29T17:10:30+00:00 ― 5 min ler

Som UnDiff: Uma Nova Abordagem pra Clareza de Áudio

UnDiff melhora a qualidade do áudio usando técnicas inovadoras de restauração de fala.

2025-10-29T16:21:55+00:00 ― 7 min ler

Computação e linguagem Novas Descobertas sobre Modelagem de Linguagem Falada Generativa

Pesquisadores analisam como o GSLM processa a fala em ambientes barulhentos.

2025-10-29T15:33:20+00:00 ― 7 min ler

Som Avanços na Tecnologia de Detecção de Gagueira

Novos métodos em aprendizado de máquina melhoram as capacidades de detecção de gagueira.

2025-10-29T14:44:45+00:00 ― 6 min ler

Som EmoMix: Avançando a Sintetização de Fala Emocional

EmoMix permite criar falas que expressam emoções mistas com intensidade certa.

2025-10-29T13:56:10+00:00 ― 6 min ler

Som MW-MAE: Uma Nova Abordagem para Aprendizado de Áudio

Descubra o método inovador de Autoencoder Máscara de Múltiplas Janelas para aprimorar o processamento de áudio.

2025-10-29T11:30:25+00:00 ― 6 min ler

Som Melhorando a Restauração de Áudio com Dicas Visuais

Um método novo combina dados de áudio e visuais pra consertar fala que tá faltando.

2025-10-29T10:41:50+00:00 ― 7 min ler

Computação e linguagem Abordando o Discurso de Ódio em Línguas de Baixos Recursos

Explorando métodos para detectar discurso de ódio em transmissões de áudio de línguas com poucos recursos.

2025-10-29T09:04:40+00:00 ― 5 min ler

Processamento de Áudio e Fala Revitalizando o Som: O Método BABE para Restauração de Áudio

Um novo método restaura as altas frequências perdidas em gravações históricas.

2025-10-29T06:38:55+00:00 ― 8 min ler

Processamento de Áudio e Fala Melhorando a tecnologia de ASR com minimização da entropia generalizada em nível sequencial

Um novo método melhora os sistemas de reconhecimento de fala automático pra mais precisão e adaptabilidade.

2025-10-29T02:36:00+00:00 ― 7 min ler

Som Avanço na Simulação de Som com o BEDRF

Um novo modelo melhora a difração de som em ambientes virtuais.

2025-10-29T01:47:25+00:00 ― 8 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Viés Contextual

O viés contextual melhora os sistemas de reconhecimento de fala, aumentando a precisão em tarefas específicas.

2025-10-29T00:58:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Conversão de Emoção na Fala

Uma nova forma de mudar as emoções na fala em meio ao barulho do dia a dia.

2025-10-28T23:21:40+00:00 ― 7 min ler

Som Novo Método para Melhorar a Detecção da Pronúncia em Línguas

Esse estudo apresenta um novo sistema pra detectar erros de pronúncia em quem tá aprendendo língua.

2025-10-28T21:44:30+00:00 ― 7 min ler

Som Uma Nova Abordagem para Reorganização Musical

O sistema de Q A usa aprendizado auto-supervisionado pra rearranjar músicas de um jeito inovador.

2025-10-28T20:07:20+00:00 ― 6 min ler

Som Melhorando a Síntese de Fala Expressiva com TVC-GMM

Um novo método melhora a qualidade da conversão de texto em fala e a expressão emocional.

2025-10-28T18:30:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Aprimorando a Clareza da Fala com Técnicas Audiovisuais

Pesquisadores juntam dados de áudio e vídeo pra melhorar a compreensão da fala em lugares barulhentos.

2025-10-28T17:41:35+00:00 ― 5 min ler

Processamento de Áudio e Fala Controle Ativo de Ruído: Reduzindo Sons Indesejados

Descubra como a tecnologia de controle ativo de ruído tá mudando nossa experiência sonora.

2025-10-28T16:53:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando o Reconhecimento de Fala com Modelos Menores

Técnicas pra diminuir o tamanho do modelo sem perder desempenho tão estão surgindo.

2025-10-28T15:15:50+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços em Efeitos de Fase Digital

Novo modelo imita efeitos de fase analógicos com técnicas de aprendizado melhoradas.

2025-10-28T12:50:05+00:00 ― 6 min ler

Computação e linguagem Avançando o Reconhecimento de Fala Multilíngue com DistilXLSR

Um novo modelo reduz o tamanho enquanto melhora o reconhecimento de fala em várias línguas.

2025-10-28T11:12:55+00:00 ― 6 min ler

Computação e linguagem Aprimorando o Reconhecimento de Fala para Acentos Diversos

Um novo método melhora a precisão do reconhecimento de fala para sotaques africanos.

2025-10-28T09:35:45+00:00 ― 5 min ler

Processamento de Áudio e Fala Melhorando as Avaliações de Tecnologia de Fala com Relatórios Detalhados

Analisando o impacto de avaliações detalhadas em sistemas de síntese de fala.

2025-10-28T07:58:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Cancelamento de Eco

Melhorando a clareza da voz com técnicas eficazes de cancelamento de eco e aprendizado de máquina.

2025-10-28T05:32:50+00:00 ― 8 min ler

Processamento de Áudio e Fala Rastreamento em Tempo Real de Vozes Cantando com o SingNet

O SingNet melhora o acompanhamento de batidas em vozes cantando usando dados anteriores.

2025-10-28T04:44:15+00:00 ― 7 min ler

Computação e linguagem Avanços no Reconhecimento de Fala para Múltiplos Falantes

Um novo sistema melhora o reconhecimento de fala em ambientes com várias pessoas falando.

2025-10-28T00:41:20+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Leitura Labial para Fala

O LipVoicer gera fala clara a partir de vídeos silenciosos usando métodos avançados de leitura labial.

2025-10-27T21:27:00+00:00 ― 6 min ler