Engenharia Eletrotécnica e Ciência dos Sistemas - Processamento de Áudio e Fala

RSS

Som AffectEcho: Ligando Emoções na Fala da IA

O modelo AffectEcho melhora a expressão emocional na fala gerada por IA.

2025-09-25T07:15:30+00:00 ― 7 min ler

Computação e linguagem Melhorando a Conversão de Grafemas para Fonemas com Novo Método de Amostragem

Este estudo melhora os modelos G2P ao focar nas áreas propensas a erros durante o treinamento.

2025-09-25T05:38:20+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços nas Técnicas de Acompanhamento de Formantes

Descubra métodos que melhoram a precisão no rastreamento de formantes para análise de fala.

2025-09-24T22:21:05+00:00 ― 8 min ler

Processamento de Áudio e Fala Usando Análise de Fala pra Avaliar a Severidade da Doença de Parkinson

Pesquisadores desenvolvem métodos baseados em voz para avaliar melhor a doença de Parkinson.

2025-09-24T21:32:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanço na Detecção de Som com Técnicas de Meta-Aprendizado

Meta-SELD melhora a localização de eventos sonoros em ambientes diversos.

2025-09-24T19:55:20+00:00 ― 6 min ler

Aprendizagem de máquinas Momentos Audiovisuais no Tempo: Um Novo Conjunto de Dados para Reconhecimento de Ações

A AVMIT dá pros pesquisadores umas ideias de como o som e a visão se relacionam no reconhecimento de ações.

2025-09-24T07:46:35+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Previsão de Qualidade de Áudio com GML

Um novo modelo de IA melhora a previsão das pontuações de qualidade de áudio.

2025-09-24T03:43:40+00:00 ― 6 min ler

Som Geração de Música com IA: Um Estudo sobre Técnicas de Amostragem

Essa pesquisa analisa como os métodos de amostragem afetam a qualidade da música gerada por IA.

2025-09-24T02:55:05+00:00 ― 6 min ler

Som Avanços na Tecnologia de Anti-Spoofing de Áudio

Um novo método melhora a detecção de áudio falso em sistemas de reconhecimento de voz.

2025-09-23T23:40:45+00:00 ― 8 min ler

Processamento de Áudio e Fala Avanços na Detecção de Batidas para Música Clássica

Novos métodos melhoram a precisão do rastreamento de batidas em música clássica complexa.

2025-09-23T14:46:20+00:00 ― 7 min ler

Processamento de Áudio e Fala Entendendo o Papel da Diarização de Linguagem

Uma olhada em como a diarização de linguagem ajuda em conversas multilíngues.

2025-09-22T23:23:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços no Framework de Geração de Textura de Áudio

Um novo framework simplifica a geração de texturas de áudio reduzindo a necessidade de rotulação.

2025-09-22T22:34:40+00:00 ― 7 min ler

Som Avanços no Reconhecimento de Fala em Ambientes Barulhentos

Um novo sistema melhora o reconhecimento de voz em ambientes barulhentos usando técnicas avançadas.

2025-09-22T21:46:05+00:00 ― 6 min ler

Processamento de Áudio e Fala Avaliação do Desempenho da Linha de Base B1 do Desafio VoicePrivacy

Avaliando a eficácia da anonimização da voz sem perder o som natural.

2025-09-22T14:28:50+00:00 ― 7 min ler

Som Avanços na Classificação de Áudio com LCANets++

Novos modelos melhoram a precisão da classificação de áudio e a resistência contra barulho e ataques.

2025-09-22T12:51:40+00:00 ― 5 min ler

Som IA na Música: Ferramentas e Técnicas de Criação

Uma visão geral das ferramentas de IA para criação musical e suas características únicas.

2025-09-22T08:48:45+00:00 ― 13 min ler

Som Gerando Sons Realistas a partir de Vídeos Silenciosos

A pesquisa explora o deep learning pra criar áudio que combine com conteúdo de vídeo silencioso.

2025-09-22T04:45:50+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Combinando Som e Visuais pra Melhorar a Qualidade do Áudio

Um novo método melhora gravações de áudio usando pistas visuais.

2025-09-22T03:57:15+00:00 ― 7 min ler

Processamento de Áudio e Fala Avaliando a Qualidade da Fala com Modelos XLS-R

Uma olhada em como os modelos XLS-R melhoram a avaliação da qualidade do áudio em reuniões online.

2025-09-22T01:31:30+00:00 ― 6 min ler

Som Aprimorando a Marcação de Áudio com o Framework CED

Um novo método melhora o desempenho e a eficiência da marcação de áudio.

2025-09-22T00:42:55+00:00 ― 6 min ler

Som Novo Estudo sobre Como Detectar Fala Gerada por IA

A pesquisa destaca métodos de detecção em tempo real para áudios falsos criados por IA.

2025-09-21T19:02:50+00:00 ― 6 min ler

Som Whombat: Uma Nova Ferramenta para Pesquisa Bioacústica

A Whombat facilita a anotação de gravações de som para pesquisa de vida selvagem.

2025-09-21T18:14:15+00:00 ― 5 min ler

Som Avanços nas Técnicas de Melhoria de Áudio

Novas estratégias melhoram a clareza da fala em ambientes barulhentos pra uma melhor reconhecimento.

2025-09-21T17:25:40+00:00 ― 7 min ler

Multimédia Ligando Emoções nas Imagens à Busca de Música

Um novo sistema conecta imagens emocionais à música pra melhorar a descoberta.

2025-09-21T16:37:05+00:00 ― 7 min ler

Som Melhorando a Qualidade da Música em Gravações do Dia a Dia

Um novo sistema melhora gravações de áudio pra uma experiência de escuta melhor.

2025-09-21T15:48:30+00:00 ― 7 min ler

Som Melhorando a Bioacústica com Técnicas de Aprendizado Ativo

Uma nova abordagem reduz a rotulagem de dados enquanto melhora a precisão da classificação de áudio.

2025-09-21T14:11:20+00:00 ― 6 min ler

Som Avanços na tecnologia de texto para fala para uma fala mais natural

Um novo sistema melhora a qualidade da fala e a expressividade na síntese de parágrafos.

2025-09-21T11:45:35+00:00 ― 6 min ler

Som Avaliar a Qualidade da Música Gerada por IA

Descubra métodos para avaliar a qualidade da música criada por IA, usando avaliações subjetivas e objetivas.

2025-09-21T10:08:25+00:00 ― 6 min ler

Som Novas descobertas sobre o movimento da língua durante a fala

A pesquisa foca nos movimentos da língua pra ajudar na terapia da fala e no aprendizado de idiomas.

2025-09-21T04:28:20+00:00 ― 5 min ler

Processamento de Áudio e Fala Impacto de Gênero em Sistemas Biométricos de Voz

Esse estudo analisa como o gênero afeta a utilidade, privacidade e justiça da biometria vocal.

2025-09-20T19:33:55+00:00 ― 8 min ler

Som Melhorando a Sintetização de Voz com Técnicas de Poda

Novos métodos de poda melhoram o desempenho de modelos de texto-para-fala de múltiplos falantes em zero-shot.

2025-09-20T15:31:00+00:00 ― 8 min ler

Computação e linguagem Entendendo Emoções em Conversas de Emergência

Pesquisas sobre reconhecimento de emoções em interações de chamadas de emergência trazem insights importantes.

2025-09-20T14:42:25+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços em Aprendizado Auto-Supervisionado para Reconhecimento de Fala

Novos métodos para selecionar dados de fala minimizam a rotulagem enquanto melhoram a precisão do reconhecimento.

2025-09-20T13:53:50+00:00 ― 6 min ler

Som Avançando o Reconhecimento de Emoções em Fala com Transformador de Tempo-Frequência

Um novo método melhora o reconhecimento de emoções na fala analisando tempo e frequência.

2025-09-20T12:16:40+00:00 ― 6 min ler

Física Quântica Tecnologia Quântica Encontra a Criação Musical

Explore como ferramentas quânticas transformam a produção musical para os artistas.

2025-09-20T08:57:42+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Avaliação da Qualidade da Fala com Pontuações de Preferência

Um novo método melhora a classificação da qualidade de fala usando as notas de preferência dos ouvintes.

2025-09-20T07:25:10+00:00 ― 6 min ler

Som Melhorando o Reconhecimento de Fala para Pessoas com Gagueira

Um método pra melhorar os sistemas de reconhecimento de voz pra usuários que gaguejam.

2025-09-20T06:36:35+00:00 ― 6 min ler

Som Problemas de Acesso no Conjunto de Dados Million Song

Desafios pra acessar dados de áudio atrapalham as oportunidades de pesquisa.

2025-09-20T00:07:55+00:00 ― 5 min ler

Som Avanços na Tecnologia de Isolamento de Voz

Novos métodos melhoram a clareza em ambientes barulhentos por meio de processamento de som avançado.

2025-09-19T22:30:45+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na tecnologia de síntese de fala em francês

Um sistema recém-desenvolvido gera fala francesa realista para uma competição.

2025-09-19T21:42:10+00:00 ― 6 min ler