Engenharia Eletrotécnica e Ciência dos Sistemas - Processamento de Áudio e Fala

RSS

Processamento de Áudio e Fala Avançando o Reconhecimento Automático de Fala Multilíngue com Máscaras Adaptativas

Uma nova abordagem melhora a eficiência em modelos de ASR multilíngues ao integrar técnicas de mascaramento adaptativo.

2025-09-06T09:00:15+00:00 ― 5 min ler

Som Usando Áudio Deepfake para Melhores Sistemas de Transcrição

Investigando áudio deepfake pra melhorar modelos de transcrição pra línguas menos comuns.

2025-09-06T07:23:05+00:00 ― 10 min ler

Aprendizagem de máquinas Melhorando o Aprendizado com Rótulos Fracos Através da Seleção de Exemplos Negativos

Novas estratégias melhoram o aprendizado com rótulos fracos ao selecionar exemplos negativos relevantes.

2025-09-06T04:57:20+00:00 ― 7 min ler

Som Nova Técnica de Marcação para Modelos de Áudio

Um método novo pra marcar áudio criado por modelos de difusão pra proteger a propriedade.

2025-09-06T04:08:45+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Redes de Memória

Novas técnicas melhoram os sistemas de ASR para reconhecer melhor discursos longos.

2025-09-06T03:20:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços em Sistemas de Detecção de Palavras-chave

Novas técnicas visam aumentar a precisão dos dispositivos ativados por voz contra ataques.

2025-09-06T01:43:00+00:00 ― 7 min ler

Processamento de Áudio e Fala DurIAN-E: Avançando a Tecnologia de Texto para Fala

DurIAN-E melhora a fala sintética com uma expressividade e fluidez mais naturais.

2025-09-06T00:54:25+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Reconhecimento de Emoções na Fala

Descubra como o SER melhora as interações entre humanos e máquinas através da detecção de emoções.

2025-09-06T00:05:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Seleção Eficiente de Modelos para Reconhecimento de Fala

Um método pra escolher o melhor modelo de ASR baseado nas características do áudio.

2025-09-05T23:17:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Clareza da Fala com Técnicas de Dereverberação

Saiba como a desreverberação melhora o reconhecimento de fala em ambientes barulhentos.

2025-09-05T12:45:40+00:00 ― 5 min ler

Som Apresentando o Coco-Nut: Um Banco de Voz Completo para TTS

A Coco-Nut oferece amostras de voz japonesa diversas pra aplicativos avançados de texto pra fala.

2025-09-05T11:57:05+00:00 ― 12 min ler

Processamento de Áudio e Fala Novo Método para Estimativa de Volume de Cômodos Usando Modelos de Atenção

Esse estudo apresenta um modelo baseado em atenção pra estimar volumes de cômodos a partir de gravações de áudio.

2025-09-05T11:08:30+00:00 ― 6 min ler

Som Apresentando o ASCA: Uma Nova Abordagem para Classificação de Áudio

O modelo ASCA melhora a precisão da classificação de áudio para conjuntos de dados pequenos.

2025-09-05T10:19:55+00:00 ― 7 min ler

Computação e linguagem Meu Projeto de Tutor de Ciências: Uma Nova Maneira de Aprender

MyST tem como objetivo melhorar o aprendizado de ciências das crianças por meio de tutoria virtual.

2025-09-05T09:31:20+00:00 ― 5 min ler

Som Avaliação da Localização de Eventos Sonoros com Diferentes Configurações de Áudio

Estudo compara a precisão de localização do som em formatos de áudio de quatro canais e dois canais.

2025-09-05T08:42:45+00:00 ― 6 min ler

Som Avanços na Tecnologia de Transcrição de Reuniões

Uma olhada no M2MeT 2.0 e seu impacto na transcrição de reuniões.

2025-09-05T03:51:15+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Anonimização de Falantes Usando Codecs de Áudio Neural

Um novo método de processamento de áudio melhora o anonimato do falante enquanto mantém a clareza da fala.

2025-09-05T01:25:30+00:00 ― 6 min ler

Som Transformando Movimentos da Língua em Sons da Fala

Este estudo transforma dados de ressonância magnética da língua em áudio de fala real.

2025-09-04T22:11:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços e Desafios nos Modelos de Reconhecimento de Fala

Este estudo analisa como a compressão de modelos afeta o reconhecimento de fala em ambientes barulhentos.

2025-09-04T19:45:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Detecção de Eventos Sonoros com OAL

Explore como o Aprendizado Ativo Online melhora a eficiência do reconhecimento de sons.

2025-09-04T18:56:50+00:00 ― 7 min ler

Som Avanços em Modelos de Reconhecimento de Áudio e Fala

Um novo modelo melhora a compreensão da fala e dos sons ao mesmo tempo.

2025-09-04T18:08:15+00:00 ― 6 min ler

Aprendizagem de máquinas Classificação Automática em Entrevistas Motivacionais

Um sistema que classifica a linguagem dos clientes em sessões de terapia usando vários métodos de comunicação.

2025-09-04T16:31:05+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Detecção de Disartria Usando Aprendizado de Máquina

Nova tecnologia melhora a detecção de disartria e a classificação de gravidade.

2025-09-04T11:39:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Detecção de Patologias Vocais

Novos métodos melhoram a detecção precoce de problemas de voz usando características da fonte glotal.

2025-09-04T10:02:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala para Acentos Diversos

Melhorando modelos de fala pra reconhecer e se adaptar melhor a diferentes sotaques.

2025-09-04T08:25:15+00:00 ― 5 min ler

Som Avanços na Classificação de Áudio Usando DCLS

DCLS melhora o desempenho na classificação de áudio aprendendo as posições do núcleo durante o treinamento.

2025-09-04T07:36:40+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Melhorando o Aprendizado Audiovisual com Co-Aumentação de Velocidade

Um novo método melhora o aprendizado de máquina de dados áudio-visuais.

2025-09-04T05:59:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Extração de Fala

Apresentando novos modelos pra melhorar a extração de fala em ambientes barulhentos.

2025-09-04T02:45:10+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Adaptação de Baixa Classificação

Um novo método melhora a eficiência do reconhecimento de fala usando adaptação de baixo rank.

2025-09-04T00:19:25+00:00 ― 6 min ler

Processamento de Sinal Uma Nova Abordagem para Identificar Sintomas de Esquizofrenia

Juntando áudio, vídeo e texto pra melhorar as avaliações de saúde mental.

2025-09-03T22:42:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Novas Técnicas

Uma olhada nas melhorias em reconhecimento de fala pra aumentar a velocidade e a precisão.

2025-09-03T21:05:05+00:00 ― 6 min ler

Computação e linguagem Ligando as lacunas de idioma na saúde

Melhorando a comunicação entre médico e paciente com tecnologias avançadas de reconhecimento de voz.

2025-09-03T18:39:20+00:00 ― 7 min ler

Criptografia e segurança Os Riscos de Privacidade dos Dispositivos Controlados por Voz

Explore as ameaças de privacidade e segurança da tecnologia controlada por voz.

2025-09-03T16:13:35+00:00 ― 5 min ler

Som A Melodia da Synthia: Uma Nova Ferramenta para Pesquisa de Áudio

A Melodia da Synthia ajuda os pesquisadores a testarem modelos de áudio com dados variados.

2025-09-03T14:36:25+00:00 ― 6 min ler

Computação e linguagem Enfrentando Desafios no Reconhecimento Automático de Fala de Longo Prazo

A pesquisa foca em melhorar os sistemas de ASR para áudio não segmentado.

2025-09-03T13:47:50+00:00 ― 5 min ler

Processamento de Áudio e Fala Avançando a Síntese Vocal para Áudio Realista

A pesquisa foca em otimizar sintetizadores para vocalizações humanas em diferentes mídias.

2025-09-03T09:44:55+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Verificação de Fala: Lidando com a Variabilidade de Sessões

Um novo método melhora a verificação de falantes gerenciando a variabilidade das sessões de forma eficaz.

2025-09-03T08:56:20+00:00 ― 7 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Grandes Modelos de Linguagem

Os LLMs melhoram a precisão e a correção de erros em sistemas de reconhecimento de fala.

2025-09-03T06:30:35+00:00 ― 6 min ler

Processamento de Áudio e Fala MC-SimCLR: Avançando o Aprendizado Sonoro e a Consciência de Localização

Um novo método melhora o reconhecimento de som e a localização da fonte sem precisar de rótulos.

2025-09-03T00:50:30+00:00 ― 6 min ler

Computação e linguagem HyPoradise: Aumentando a Precisão do Reconhecimento Automático de Fala

Um novo padrão pra melhorar a precisão do ASR usando modelos de linguagem.

2025-09-02T23:13:20+00:00 ― 7 min ler