Engenharia Eletrotécnica e Ciência dos Sistemas - Processamento de Áudio e Fala

RSS

Processamento de Áudio e Fala Melhorando ASR de Code-Switching com Destilação de Conhecimento

Um novo framework melhora a performance de ASR usando dados e recursos limitados.

2025-07-15T22:41:45+00:00 ― 6 min ler

Som Avanço da Síntese de Áudio com Modelos de Difusão

Um novo método melhora a eficiência na geração de áudio usando técnicas de atenção inovadoras.

2025-07-15T20:16:00+00:00 ― 6 min ler

Som BandControlNet: Uma Nova Abordagem para Criação Musical

Descubra como a IA tá transformando a geração de música com o BandControlNet.

2025-07-15T19:27:25+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Voz por Robôs Móveis

Um robô móvel aprende a reconhecer vozes em ambientes barulhentos para aplicações práticas.

2025-07-15T16:13:05+00:00 ― 5 min ler

Processamento de Áudio e Fala Vibravox: Avançando a Tecnologia de Reconhecimento de Voz

Um novo conjunto de dados visa melhorar a captura de voz usando sensores de condução pelo corpo.

2025-07-15T14:35:55+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Novo Método para Detectar Deepfakes

Uma nova abordagem melhora a detecção de deepfakes usando análise áudio-visual.

2025-07-15T12:10:10+00:00 ― 7 min ler

Som A Evolução dos Sistemas de Reconhecimento Automático de Fala

Um olhar sobre o progresso nas tecnologias e métodos de reconhecimento de fala.

2025-07-15T11:21:35+00:00 ― 6 min ler

Som Melhorando a Detecção de Gagueira com o MMSD-Net

Um novo método melhora a detecção de gagueira combinando dados de áudio, vídeo e texto.

2025-07-15T07:18:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços em Sistemas de Diarização de Fala e Linguagem

Uma equipe melhora o processamento de áudio para identificação de falantes e idiomas.

2025-07-15T03:15:45+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Emoções pela Fala

Pesquisas sobre detectar emoções humanas pela fala mostram potencial para várias aplicações.

2025-07-15T00:50:00+00:00 ― 6 min ler

Som Geração de Som Inovadora para Modelos Humanos em 3D

Um novo método melhora a criação de som para modelos humanos 3D realistas.

2025-07-15T00:01:25+00:00 ― 8 min ler

Som Estimando Taxas de Respiração Através da Análise da Fala

Esse estudo mostra como a fala pode estimar taxas de respiração usando modelos avançados.

2025-07-14T23:12:50+00:00 ― 6 min ler

Som GraphMuse: Uma Nova Ferramenta para Análise Musical

GraphMuse facilita a análise de dados musicais simbólicos com técnicas avançadas de aprendizado de máquina.

2025-07-14T19:58:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala para a Língua Polonesa

A pesquisa apresenta novos métodos para avaliar sistemas de reconhecimento de fala em polonês.

2025-07-14T16:44:10+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando a Formatação de Números em Transcrições de ASR

Este artigo fala sobre maneiras de melhorar a formatação de expressões numéricas em transcrições automáticas.

2025-07-14T15:55:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços nas Técnicas de Classificação Musical

Aprendizado auto-supervisionado transforma o reconhecimento musical através de métodos inovadores.

2025-07-14T12:41:15+00:00 ― 6 min ler

Processamento de Áudio e Fala MSceneSpeech: Avanço na Síntese de Fala em Mandarim

Um novo conjunto de dados melhora a fala de máquina em mandarim, com o objetivo de uma expressão mais natural.

2025-07-14T09:26:55+00:00 ― 7 min ler

Multimédia Avançando a Localização de Fontes Sonoras através da Integração Áudio-Vídeo

Um estudo sobre como melhorar a localização de fontes sonoras aproveitando melhor as informações audiovisuais.

2025-07-14T06:12:35+00:00 ― 8 min ler

Aprendizagem de máquinas Avaliando a Saúde Cognitiva através da Análise de Fala

Um novo modelo analisa a fala pra identificar leve comprometimento cognitivo em várias línguas.

2025-07-14T05:24:00+00:00 ― 6 min ler

Som IA e o Desafio dos Gêneros Musicais Diversos

Explorando o impacto da IA em estilos musicais sub-representados.

2025-07-14T02:58:15+00:00 ― 7 min ler

Computação e linguagem Melhorando o Texto-para-Fala para Línguas Indianas

Um jeito de melhorar os sistemas de TTS pra pronunciar melhor palavras fora do vocabulário na Índia.

2025-07-14T02:09:40+00:00 ― 6 min ler

Computação e linguagem Aprimorando o Aprendizado Auto-Supervisionado para Processamento de Fala

Um novo modelo melhora a eficiência no processamento de fala com menos consumo de energia.

2025-07-14T00:32:30+00:00 ― 5 min ler

Som Avanços na Tecnologia de Aparelhos Auditivos Usando Aprendizado de Máquina

Novos modelos de aprendizado de máquina melhoram a clareza da fala para usuários de aparelhos auditivos.

2025-07-13T23:43:55+00:00 ― 7 min ler

Som Estudando Interações Sociais com Áudio de Baixa Frequência

A pesquisa explora áudio de baixa frequência pra proteger a privacidade em estudos de comportamento social.

2025-07-13T21:18:10+00:00 ― 7 min ler

Processamento de Áudio e Fala Entendendo a Propagação do Som em Espaços Conectados

Explorando como o som se comporta em ambientes com várias salas e suas implicações na tecnologia.

2025-07-13T20:29:35+00:00 ― 7 min ler

Processamento de Áudio e Fala Ferramentas de IA Transformam o Processo de Edição de Música

Novas ferramentas de IA estão simplificando a edição de música com técnicas inovadoras e precisão melhorada.

2025-07-13T18:52:25+00:00 ― 6 min ler

Computação e linguagem Uma Nova Abordagem para Tradução de Fala: Combinação de Voz Pré-definida

A combinação de voz pré-definida melhora a tradução de fala enquanto garante privacidade e diminui riscos.

2025-07-13T18:03:50+00:00 ― 7 min ler

Som Assistente de Compositor 2: Uma Nova Ferramenta para Músicos

Um novo sistema ajuda músicos a criar músicas com mais controle e precisão.

2025-07-13T14:00:55+00:00 ― 8 min ler

Som Avaliando o Impacto da IA na Originalidade da Música

Uma nova ferramenta pra avaliar a replicação em música feita por IA.

2025-07-13T12:23:45+00:00 ― 8 min ler

Som Geração de Áudio Aberta: Um Novo Modelo

Um novo modelo de texto pra áudio usando só dados públicos.

2025-07-13T11:35:10+00:00 ― 6 min ler

Computação e linguagem Desafios e Inovações na Pesquisa sobre Alternância de Código

Um novo conjunto de dados tem o objetivo de melhorar a compreensão da troca de código entre várias línguas.

2025-07-13T09:58:00+00:00 ― 6 min ler

Computação e linguagem Representação de Gênero nas Notícias da TV Francesa

Esse artigo examina o equilíbrio de gênero nas transmissões de notícias francesas em diferentes temas.

2025-07-13T08:20:50+00:00 ― 6 min ler

Computação e linguagem Rasa: Uma Revolução na Síntese de Fala em Línguas Indianas

O dataset Rasa melhora a conversão de texto em fala para línguas indianas com uma fala neutra e expressiva.

2025-07-13T05:55:05+00:00 ― 7 min ler

Som Avanços na Tecnologia de Reconhecimento de Emoções na Fala

Novos métodos melhoram a compreensão das emoções humanas na fala pela máquina.

2025-07-12T18:34:55+00:00 ― 5 min ler

Som Tornando Ferramentas de IA Acessíveis para Artistas

Simplificar ferramentas de IA pode ajudar artistas a melhorar sua expressão criativa.

2025-07-12T17:46:20+00:00 ― 5 min ler

Som MusiConGen: Avançando a Tecnologia de Texto pra Música

O MusiConGen melhora o controle do usuário na geração de texto para música.

2025-07-12T16:57:45+00:00 ― 7 min ler

Neurónios e Cognição Avanços na tecnologia de EEG para recuperação da fala

Pesquisadores melhoram a decodificação da fala usando EEG pra ajudar quem tem dificuldades de fala.

2025-07-12T16:20:33+00:00 ― 8 min ler

Processamento de Áudio e Fala Avanços em Técnicas de Melhoria de Voz

Um novo modelo melhora a clareza da fala, atacando ruídos e ecos.

2025-07-12T15:20:35+00:00 ― 6 min ler

Computação e linguagem Apresentando o J-CHAT: Um Novo Conjunto de Dados para Pesquisa em Diálogos Orais

O J-CHAT fornece um grande conjunto de dados de código aberto pra melhorar sistemas de diálogo falado.

2025-07-12T12:06:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Criação de Instrumentos Musicais Baseados em Amostras

Novos métodos permitem que músicos criem instrumentos a partir de comandos de som.

2025-07-12T08:51:55+00:00 ― 6 min ler