Engenharia Eletrotécnica e Ciência dos Sistemas - Processamento de Áudio e Fala

RSS

Som Convertendo Áudio Mono pra Estéreo Imersivo

Um novo método transforma sinais mono em experiências estéreo envolventes.

2025-10-17T01:31:45+00:00 ― 7 min ler

Computação e linguagem Avançando o Reconhecimento de Emoções em Diferentes Idades e Idiomas

Um estudo sobre como melhorar a detecção de emoções na fala para grupos diversos.

2025-10-16T23:06:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Conjuntos Baseados em Confiança

Esse artigo fala sobre como melhorar o reconhecimento de fala usando métodos de ensemble baseados em confiança.

2025-10-16T18:14:30+00:00 ― 6 min ler

Multimédia Revolucionando o Monitoramento do Sono de Bebês com o LittleBeats

Estudo usa dispositivo multi-dados pra rastrear padrões de sono de bebês de forma mais precisa.

2025-10-16T17:25:55+00:00 ― 5 min ler

Computação e linguagem Apresentando o 3D-Speaker: Um Novo Recurso para Pesquisa em Fala

O 3D-Speaker oferece uma enorme coleção de gravações de áudio para uma análise de fala avançada.

2025-10-16T16:37:20+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando no Texto para Fala: Modelo GenerTTS Explicado

O GenerTTS melhora a tecnologia de texto-para-fala para aplicativos multilíngues.

2025-10-16T15:48:45+00:00 ― 6 min ler

Som Enfrentando o Desafio dos Deepfakes de Áudio

Um novo sistema melhora a detecção de áudio manipulado com técnicas inovadoras.

2025-10-16T15:00:10+00:00 ― 6 min ler

Som Avanços no Reconhecimento de Fala com Várias Pessoas Falando

Melhorar o reconhecimento de fala para vozes sobrepostas aumenta a usabilidade em várias situações.

2025-10-16T11:45:50+00:00 ― 6 min ler

Som Melhorando as técnicas de extração de falantes

Novos métodos melhoram a separação de vozes em ambientes de áudio misturado.

2025-10-16T10:57:15+00:00 ― 5 min ler

Som Avanços na Tecnologia de Extração de Falantes Alvo

Descubra como novas técnicas melhoram a clareza da fala em ambientes barulhentos.

2025-10-16T10:08:40+00:00 ― 6 min ler

Som UnitSpeech: Personalizando Texto-para-Fala com Poucos Dados

Um novo método pra deixar a síntese de voz mais personalizada usando menos dados de fala.

2025-10-16T06:54:20+00:00 ― 6 min ler

Som Avanços no Processamento de Áudio com Redes Neurais de Grafo

Novos métodos melhoram a localização do som usando matrizes de microfones distribuídas.

2025-10-16T06:05:45+00:00 ― 6 min ler

Processamento de Áudio e Fala Equilibrando Privacidade e Utilidade na Análise de Fala

Este estudo analisa métodos para proteger a privacidade enquanto se analisa conversas faladas.

2025-10-16T05:17:10+00:00 ― 7 min ler

Som Novas Vulnerabilidades em Sistemas de Reconhecimento de Voz

Ataques recentes de backdoor expõem riscos nas tecnologias de identificação por voz.

2025-10-16T02:51:25+00:00 ― 8 min ler

Som Avançando a Tecnologia de Isolamento de Voz

Um novo modelo melhora a extração de fala de fundos barulhentos usando aprendizado profundo.

2025-10-16T02:02:50+00:00 ― 5 min ler

Processamento de Áudio e Fala Apresentando o GOLF: Uma Nova Era na Síntese de Voz Cantante

O GOLF traz uma nova maneira de criar cantoria parecida com a humana usando menos recursos.

2025-10-15T16:19:50+00:00 ― 7 min ler

Som Avanços na Previsão de Idade e Gênero Baseada na Voz

Pesquisa sobre como prever idade e gênero a partir de dados de voz usando modelos inovadores.

2025-10-15T13:54:05+00:00 ― 5 min ler

Som Analisando Música com Árvores de Dependência

Um jeito novo de entender as relações musicais através de árvores de dependência.

2025-10-15T13:05:30+00:00 ― 7 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Modelos de Longo Contexto

Este artigo fala sobre novos modelos que melhoram a precisão do reconhecimento de fala considerando um contexto mais longo.

2025-10-15T12:16:55+00:00 ― 6 min ler

Computação e linguagem Apresentando o LyricWhiz: Transformando a Transcrição de Letras

LyricWhiz junta modelos avançados pra melhorar a precisão da transcrição de letras em várias línguas.

2025-10-15T09:51:10+00:00 ― 7 min ler

Som Classificando Chamados de Aves Africanas Através da Análise de Áudio

Um estudo sobre como usar gravações sonoras pra identificar diferentes espécies de pássaros na África.

2025-10-15T09:02:35+00:00 ― 7 min ler

Computação Neural e Evolutiva Avançando Redes Neurais com Espinhas Através do Aprendizado de Atraso

Novo método melhora o aprendizado em Redes Neurais Spiking ao incluir ajustes de atraso.

2025-10-15T07:25:25+00:00 ― 7 min ler

Recuperação de informação Como as Recomendações Musicais Usam Análise de Dados

Saiba como os sistemas de recomendação sugerem músicas com base nas preferências dos usuários.

2025-10-15T02:33:55+00:00 ― 6 min ler

Aprendizagem de máquinas Abordando o desequilíbrio de dados na classificação de áudio

Este artigo discute os desafios e técnicas para lidar com o desequilíbrio de dados na classificação de áudio.

2025-10-15T00:08:10+00:00 ― 7 min ler

Computação e linguagem Avançando o Reconhecimento de Fala para Idiomas de Baixos Recursos

Uma nova abordagem melhora o reconhecimento de fala em romeno usando inibição lateral.

2025-10-14T23:19:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando a Privacidade de Gênero em Áudio: Novas Ideias

Pesquisa destaca métodos para proteger a privacidade de gênero em áudio falado.

2025-10-14T21:42:25+00:00 ― 7 min ler

Som Entendendo Emoções no Reconhecimento de Fala

Um olhar sobre como capturar emoções por trás das palavras faladas de forma mais precisa.

2025-10-14T16:02:20+00:00 ― 5 min ler

Som Avançando a Classificação Musical com Embeddings de Áudio

Usar embeddings de áudio pré-treinados leva a modelos de classificação musical melhores.

2025-10-14T13:36:35+00:00 ― 8 min ler

Processamento de Áudio e Fala Novo modelo melhora a compreensão do processamento da fala no cérebro

Pesquisas destacam o papel das fronteiras de palavras na fala e na atividade de EEG.

2025-10-14T11:59:25+00:00 ― 7 min ler

Som Avanços na Tecnologia de Síntese de Fala a partir de Lábios

Novo sistema melhora a clareza da fala em vídeos silenciosos através de um processamento aprimorado.

2025-10-13T19:47:45+00:00 ― 7 min ler

Som A Ciência por trás do Mridangam: Um Instrumento Único

Descubra a mistura de arte e ciência ao estudar o mridangam.

2025-10-13T17:19:15+00:00 ― 8 min ler

Computação e linguagem Avançando o Reconhecimento de Fala para Línguas com Poucos Recursos

Um novo método melhora o reconhecimento de palavras personalizadas em sistemas de ASR para idiomas com dados limitados.

2025-10-13T13:19:05+00:00 ― 6 min ler

Som Avanços na Detecção de Áudio Falso Usando Modelos Conformer

Pesquisadores desenvolvem um modelo Conformer pra melhorar a detecção de áudio falso.

2025-10-13T03:36:05+00:00 ― 5 min ler

Processamento de Áudio e Fala Proteger a privacidade de gênero em sistemas de reconhecimento de voz

Um método pra esconder informações de gênero enquanto garante a verificação de identidade em reconhecimento de voz.

2025-10-12T22:44:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando a Detecção do Alzheimer através da Análise da Fala

Novos métodos melhoram a detecção precoce do Alzheimer usando análise de fala e áudio.

2025-10-12T19:30:15+00:00 ― 8 min ler

Processamento de Áudio e Fala Nova Base de Dados Revela Insights sobre os Sons de Instrumentos Musicais

Explore dados de som de 41 instrumentos musicais com gravações detalhadas.

2025-10-12T15:27:20+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços em Embeddings Acústicos de Palavras para Linguagem Falada

Pesquisa sobre como melhorar as palavras acústicas com entendimento semântico e dados multilíngues.

2025-10-12T14:38:45+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Fala para Disartria

Novas tecnologias melhoram a comunicação para pessoas com distúrbios de fala.

2025-10-12T13:01:35+00:00 ― 7 min ler

Computação e linguagem Avanços na Tecnologia de Processamento de Fala em Tempo Real

Um novo sistema combina transcrição e tradução pra melhorar a comunicação.

2025-10-12T11:24:25+00:00 ― 5 min ler

Som Avanços no Reconhecimento de Fala com Whisper-AT

Whisper-AT junta reconhecimento de fala e marcação de áudio pra melhorar o desempenho.

2025-10-12T08:10:05+00:00 ― 7 min ler