Engenharia Eletrotécnica e Ciência dos Sistemas - Processamento de Áudio e Fala

RSS

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Modelos de Linguagem Grandes

Essa pesquisa mostra como LLMs melhoram a compreensão da fala em vídeos longos.

2025-10-23T22:42:45+00:00 ― 5 min ler

Processamento de Áudio e Fala Gestão Eficiente de Grandes Modelos de Fala

Um novo método otimiza modelos de fala pra melhor desempenho com menos recursos.

2025-10-23T21:54:10+00:00 ― 6 min ler

Processamento de Áudio e Fala Nova Método para Avaliação Objetiva de Áudio Espacial

Uma nova abordagem melhora como avaliamos a qualidade do áudio espacial.

2025-10-23T19:28:25+00:00 ― 6 min ler

Som Identificando Fala Lida vs. Fala Espontânea em Entrevistas

Um estudo sobre como diferenciar fala lida e fala espontânea.

2025-10-23T18:39:50+00:00 ― 6 min ler

Processamento de Áudio e Fala StyleTTS 2: Avançando a Tecnologia de Texto para Fala

Um novo modelo aumenta o realismo da fala sintética.

2025-10-23T15:25:30+00:00 ― 9 min ler

Processamento de Áudio e Fala Malafide: Um Novo Desafio para Sistemas de Reconhecimento de Voz

Malafide apresenta técnicas de spoofing sofisticadas, complicando as contramedidas no reconhecimento de voz.

2025-10-23T14:36:55+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços no Rastreamento de Fonte Sonora com PI-RNN

Um novo modelo melhora a precisão e a eficiência no rastreamento de fontes sonoras.

2025-10-23T10:34:00+00:00 ― 6 min ler

Computação e linguagem Apresentando o Dataset ITALIC para o Italiano Falado

Um novo conjunto de dados melhora a compreensão da linguagem falada em italiano.

2025-10-23T08:56:50+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços em Aprendizado Auto-Supervisionado para Processamento de Fala

O MCR-Data2vec 2.0 melhora o reconhecimento de fala ao deixar o modelo mais consistente.

2025-10-23T08:08:15+00:00 ― 5 min ler

Aprendizagem de máquinas EM-Network: Uma Nova Abordagem em Aprendizado de Sequências

O EM-Network melhora o aprendizado de sequências em tarefas de processamento de fala e língua.

2025-10-23T07:19:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços em Modelos de ASR Bilingues e com Troca de Códigos

Novos métodos melhoram o reconhecimento de fala multilíngue usando fontes de dados existentes.

2025-10-23T04:05:20+00:00 ― 8 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala para Línguas de Baixos Recursos

A pesquisa foca em melhorar a tecnologia de fala para idiomas que não têm dados suficientes.

2025-10-22T23:13:50+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços nas Técnicas de Aprimoramento de Fala

Um olhar sobre os desenvolvimentos recentes em melhorar a clareza do áudio usando modelos avançados.

2025-10-22T21:36:40+00:00 ― 6 min ler

Som Avaliação da Dificuldade de Peças de Piano com Novo Conjunto de Dados

Um novo conjunto de dados tem como objetivo classificar partituras de piano por nível de dificuldade.

2025-10-22T20:48:05+00:00 ― 8 min ler

Som Avanços na Melhora da Qualidade de Fala

O framework Gesper melhora a clareza da fala em ambientes barulhentos.

2025-10-22T19:59:30+00:00 ― 5 min ler

Processamento de Áudio e Fala Melhorando o Aperfeiçoamento de Fala com Técnicas de Normalização

Este estudo apresenta um novo método para melhorar a qualidade do áudio usando modelos pré-treinados.

2025-10-22T19:10:55+00:00 ― 6 min ler

Inteligência Artificial Melhorando a Detecção de Discurso de Ódio em Multimídia

Combinar áudio, vídeo e texto melhora a detecção de discurso de ódio.

2025-10-22T15:08:00+00:00 ― 6 min ler

Som Uma Abordagem Simplificada para HMM Híbrido em ASR

Esse artigo fala sobre um novo método pra construir sistemas de ASR eficientes.

2025-10-22T14:19:25+00:00 ― 5 min ler

Processamento de Áudio e Fala Personalizando o Reconhecimento de Voz em Dispositivos Móveis

Uma nova abordagem melhora o reconhecimento de voz direto nos smartphones, garantindo a privacidade do usuário.

2025-10-22T10:16:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Novo sistema melhora a identificação de falantes em áudio

Um novo método melhora a precisão na identificação de falantes durante conversas.

2025-10-22T09:27:55+00:00 ― 6 min ler

Som Avanços na Detecção de Eventos Bioacústicos com Poucos Exemplos

Equipes melhoram a identificação de sons de animais com poucos exemplos no desafio DCASE.

2025-10-22T07:50:45+00:00 ― 6 min ler

Som Aproveitando a marcação de áudio em computadores pequenos

Saiba mais sobre sistemas de etiquetagem de áudio e como usá-los no Raspberry Pi.

2025-10-22T06:13:35+00:00 ― 5 min ler

Som Avanços nos Algoritmos de Identificação de Covers

Novas técnicas melhoram a precisão e a eficiência na identificação de músicas cover.

2025-10-22T05:25:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Controle Ativo de Ruído

Novo método melhora o controle de ruído em espaços 3D.

2025-10-22T01:22:05+00:00 ― 5 min ler

Processamento de Áudio e Fala Novo Conjunto de Dados e Modelo para Texto-para-Fala Multilíngue

CML-TTS permite sistemas de texto-para-fala melhores em sete idiomas.

2025-10-21T18:04:50+00:00 ― 6 min ler

Som Avaliando a Qualidade da Fala com Modelos de Aprendizado de Máquina

Este estudo avalia vários modelos para prever a qualidade da fala sintetizada.

2025-10-21T16:27:40+00:00 ― 6 min ler

Som Avanços nos Métodos de Classificação de Sons de Pássaros

Pesquisadores automatizam a classificação de sons de pássaros, melhorando a precisão no monitoramento das espécies.

2025-10-21T14:50:30+00:00 ― 6 min ler

Processamento de Áudio e Fala FALL-E: Uma Nova Era na Criação de Som

FALL-E cria efeitos sonoros de alta qualidade a partir de descrições em texto.

2025-10-21T13:13:20+00:00 ― 5 min ler

Processamento de Áudio e Fala Transformando a Fala Típica pra Quem Tem Disartria

Um novo método melhora a conversão de voz para pessoas com fala atípica.

2025-10-21T05:56:05+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Fala com Vários Falantes com o SURT 2.0

O SURT 2.0 melhora o reconhecimento de fala para várias pessoas em situações em tempo real.

2025-10-21T05:07:30+00:00 ― 7 min ler

Som Apresentando o MARBLE: Um Referencial para IA Musical

MARBLE estabelece um padrão para avaliar modelos de IA musical em várias tarefas.

2025-10-21T04:18:55+00:00 ― 8 min ler

Processamento de Áudio e Fala Novo modelo melhora a detecção de sons de pássaros

Um novo método melhora a precisão na identificação de cantos de pássaros.

2025-10-21T03:30:20+00:00 ― 7 min ler

Som Melhorando o Processamento de Áudio com Camadas SFI

Novos algoritmos melhoram o desempenho do processamento de áudio em diferentes taxas de amostragem.

2025-10-21T00:16:00+00:00 ― 6 min ler

Som Usando Som pra Separar Machos de Mosquitos pra Controle de Pragas

Pesquisas exploram a análise de som pra melhorar a triagem de mosquitos no controle de doenças.

2025-10-20T21:50:15+00:00 ― 6 min ler

Som Transformando Sons Vocais com Técnicas de DSP

Explore dois métodos inovadores para alterar o timbre vocal usando Processamento Digital de Sinais.

2025-10-20T14:33:00+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços no Aprendizado de Reconhecimento Automático de Fala

Um novo método melhora a tecnologia de reconhecimento de fala sem perder o conhecimento que já foi aprendido.

2025-10-20T13:44:25+00:00 ― 7 min ler

Som Avanços na Transcrição de Música Multitrack com Perceiver TF

Um novo modelo melhora a precisão da transcrição musical para vários instrumentos.

2025-10-20T12:07:15+00:00 ― 6 min ler

Som Avanços em Processamento de Áudio com DAMAS-FISTA

Um novo método combina aprendizado tradicional e profundo para uma imagem sonora eficiente.

2025-10-20T11:18:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Reconstrução de Campo Sonoro

Novos métodos melhoram o realismo nas tecnologias de áudio usando técnicas informadas pela física.

2025-10-20T10:30:05+00:00 ― 7 min ler

Processamento de Áudio e Fala Avançando o Aprendizado de Línguas para Línguas de Baixo Recurso

Um novo modelo melhora o aprendizado de palavras usando áudio e imagens.

2025-10-20T09:41:30+00:00 ― 6 min ler