Engenharia Eletrotécnica e Ciência dos Sistemas - Processamento de Áudio e Fala

RSS

Multimédia Ligando Emoções nas Imagens à Busca de Música

Um novo sistema conecta imagens emocionais à música pra melhorar a descoberta.

2025-09-21T16:37:05+00:00 ― 7 min ler

Som Melhorando a Qualidade da Música em Gravações do Dia a Dia

Um novo sistema melhora gravações de áudio pra uma experiência de escuta melhor.

2025-09-21T15:48:30+00:00 ― 7 min ler

Som Melhorando a Bioacústica com Técnicas de Aprendizado Ativo

Uma nova abordagem reduz a rotulagem de dados enquanto melhora a precisão da classificação de áudio.

2025-09-21T14:11:20+00:00 ― 6 min ler

Som Avanços na tecnologia de texto para fala para uma fala mais natural

Um novo sistema melhora a qualidade da fala e a expressividade na síntese de parágrafos.

2025-09-21T11:45:35+00:00 ― 6 min ler

Som Avaliar a Qualidade da Música Gerada por IA

Descubra métodos para avaliar a qualidade da música criada por IA, usando avaliações subjetivas e objetivas.

2025-09-21T10:08:25+00:00 ― 6 min ler

Som Novas descobertas sobre o movimento da língua durante a fala

A pesquisa foca nos movimentos da língua pra ajudar na terapia da fala e no aprendizado de idiomas.

2025-09-21T04:28:20+00:00 ― 5 min ler

Processamento de Áudio e Fala Impacto de Gênero em Sistemas Biométricos de Voz

Esse estudo analisa como o gênero afeta a utilidade, privacidade e justiça da biometria vocal.

2025-09-20T19:33:55+00:00 ― 8 min ler

Som Melhorando a Sintetização de Voz com Técnicas de Poda

Novos métodos de poda melhoram o desempenho de modelos de texto-para-fala de múltiplos falantes em zero-shot.

2025-09-20T15:31:00+00:00 ― 8 min ler

Computação e linguagem Entendendo Emoções em Conversas de Emergência

Pesquisas sobre reconhecimento de emoções em interações de chamadas de emergência trazem insights importantes.

2025-09-20T14:42:25+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços em Aprendizado Auto-Supervisionado para Reconhecimento de Fala

Novos métodos para selecionar dados de fala minimizam a rotulagem enquanto melhoram a precisão do reconhecimento.

2025-09-20T13:53:50+00:00 ― 6 min ler

Som Avançando o Reconhecimento de Emoções em Fala com Transformador de Tempo-Frequência

Um novo método melhora o reconhecimento de emoções na fala analisando tempo e frequência.

2025-09-20T12:16:40+00:00 ― 6 min ler

Física Quântica Tecnologia Quântica Encontra a Criação Musical

Explore como ferramentas quânticas transformam a produção musical para os artistas.

2025-09-20T08:57:42+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Avaliação da Qualidade da Fala com Pontuações de Preferência

Um novo método melhora a classificação da qualidade de fala usando as notas de preferência dos ouvintes.

2025-09-20T07:25:10+00:00 ― 6 min ler

Som Melhorando o Reconhecimento de Fala para Pessoas com Gagueira

Um método pra melhorar os sistemas de reconhecimento de voz pra usuários que gaguejam.

2025-09-20T06:36:35+00:00 ― 6 min ler

Som Problemas de Acesso no Conjunto de Dados Million Song

Desafios pra acessar dados de áudio atrapalham as oportunidades de pesquisa.

2025-09-20T00:07:55+00:00 ― 5 min ler

Som Avanços na Tecnologia de Isolamento de Voz

Novos métodos melhoram a clareza em ambientes barulhentos por meio de processamento de som avançado.

2025-09-19T22:30:45+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na tecnologia de síntese de fala em francês

Um sistema recém-desenvolvido gera fala francesa realista para uma competição.

2025-09-19T21:42:10+00:00 ― 6 min ler

Som Avanços na Tecnologia de Detecção de Palavras-chave

Novos métodos melhoram a eficiência e a precisão nos sistemas de reconhecimento de voz.

2025-09-19T17:39:15+00:00 ― 6 min ler

Computação e linguagem Avanços na Modelagem de Linguagem Falada

Novos métodos melhoram o processamento e a geração de fala em modelos de linguagem.

2025-09-19T16:02:05+00:00 ― 6 min ler

Som Avanços na Tecnologia de Supressão de Ruído

Novas técnicas melhoram a clareza do áudio em ambientes barulhentos.

2025-09-19T15:13:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Avançando o reconhecimento de palavras com poucos exemplos usando dados de fala de leitura

Novos métodos melhoram a identificação de palavras-chave usando dados de fala disponíveis.

2025-09-19T13:36:20+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Extração de Som

Um olhar sobre métodos de extração de som personalizáveis por região para um áudio mais claro.

2025-09-19T07:56:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços no Rastreamento de Formantes para Processamento de Fala

Novos métodos de um único passo melhoram a precisão no acompanhamento de formantes para sons de fala.

2025-09-19T02:16:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Novas Descobertas em Tecnologia de Linguagem Falada

Uma nova perspectiva sobre os avanços nos métodos e aplicações da ciência da linguagem falada.

2025-09-19T01:27:35+00:00 ― 7 min ler

Recuperação de informação Desafios em Aprender com Videoclipes

Esse estudo analisa as dificuldades de usar aprendizado contrastivo pra entender vídeo musical.

2025-09-18T17:21:45+00:00 ― 7 min ler

Computação e linguagem Conectando Fala com Modelos de Linguagem: O Método BLSP

Uma nova abordagem melhora a integração da fala com modelos de linguagem.

2025-09-18T15:44:35+00:00 ― 7 min ler

Processamento de Áudio e Fala Avançando a Previsão de Movimento da Fala na Disartria

Usando aprendizado autossupervisionado pra melhorar previsões dos movimentos de fala na disartria.

2025-09-18T12:30:15+00:00 ― 6 min ler

Som Avaliando a Conexão entre Dança e Música com MDSC

Uma nova métrica pra avaliar como os estilos de dança combinam com a música.

2025-09-18T11:41:40+00:00 ― 9 min ler

Computação e linguagem O Papel dos Modelos de Linguagem Pré-treinados em TTS

Analisando como modelos de linguagem pré-treinados melhoram a qualidade do texto-para-fala.

2025-09-17T20:18:35+00:00 ― 6 min ler

Processamento de Áudio e Fala BWSNet: Avançando a Avaliação da Percepção Auditiva

Um novo modelo avalia a percepção auditiva através do feedback humano usando a Escala de Melhor-Pior.

2025-09-17T13:49:55+00:00 ― 6 min ler

Som Avanços nas Técnicas de Separação de Fontes Musicais

Novos métodos melhoram a clareza dos componentes de áudio nas faixas musicais.

2025-09-17T08:09:50+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando a Separação de Áudio Cinemático com o BandIt

O BandIt melhora a separação de fontes de áudio com técnicas inovadoras de deep learning.

2025-09-17T06:32:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Personalizando Sistemas de Reconhecimento de Emoção na Fala

Ajustar a tecnologia de reconhecimento de emoções melhora a precisão para diferentes falantes.

2025-09-17T04:55:30+00:00 ― 7 min ler

Som Mudança de Identidade Vocal: Uma Ameaça à Segurança

Estudo revela ameaças sérias no reconhecimento de voz usando amostras de morph.

2025-09-17T04:06:55+00:00 ― 6 min ler

Som Batik-toca-Mozart: Um Conjunto de Dados Completo de Piano

Um conjunto de dados detalhado que combina as sonatas do Mozart com performances de piano e anotações de especialistas.

2025-09-17T03:18:20+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Qualidade do Áudio para Reuniões Remotas

Um novo design de fone de ouvido melhora a clareza do som usando tecnologia de condução óssea.

2025-09-17T02:29:45+00:00 ― 9 min ler

Processamento de Áudio e Fala Avanços na Estimativa de Pitch com Aprendizado Auto-Supervisionado

Um novo modelo leve melhora a estimativa de pitch usando técnicas de aprendizado auto-supervisionado.

2025-09-17T00:04:00+00:00 ― 8 min ler

Som Avanços nas Técnicas de Análise de Estrutura Musical

Uma nova abordagem pra melhorar a identificação e análise de segmentos musicais.

2025-09-16T23:15:25+00:00 ― 6 min ler

Som Detectando Músicas Falsas: Uma Nova Abordagem de Dataset

Novos métodos criados pra identificar músicas falsas diante das crescentes preocupações.

2025-09-16T22:26:50+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Cleancoder

Cleancoder melhora os sistemas de ASR reduzindo o barulho de fundo pra entender a fala melhor.

2025-09-16T21:38:15+00:00 ― 5 min ler