Engenharia Eletrotécnica e Ciência dos Sistemas - Processamento de Áudio e Fala

RSS

Processamento de Áudio e Fala Avançando a Compreensão da Linguagem Falada com Aprendizado Contínuo

Essa pesquisa aborda o esquecimento na IA por meio do aprendizado contínuo na compreensão da linguagem falada.

2025-11-04T00:18:05+00:00 ― 9 min ler

Som Avanços na Tecnologia de Texto-Para-Fala Emocional

O novo modelo ZET-Speech melhora a síntese de fala emocional para oradores diversos.

2025-11-03T23:29:30+00:00 ― 6 min ler

Som Avanços na Transcrição de Música de Piano e Violino

Estudo descobre que novas técnicas de mixagem melhoram a precisão da transcrição musical.

2025-11-03T21:52:20+00:00 ― 5 min ler

Som Avançando a Interação Humano-Máquina com Diálogo Empático

Um novo método melhora as respostas das máquinas através de uma melhor compreensão emocional.

2025-11-03T21:03:45+00:00 ― 7 min ler

Som Avançando o Reconhecimento de Fala em Configurações com Vários Falantes

Um novo método melhora a precisão no reconhecimento automático de voz em reuniões.

2025-11-03T20:15:10+00:00 ― 6 min ler

Som Desenvolvendo Assistentes de Voz Empáticos com CALLS

O CALLS tem como objetivo melhorar a capacidade dos assistentes de voz em lidar com interações com os clientes.

2025-11-03T19:26:35+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Preenchimento de Áudio

Novos métodos melhoram a restauração de áudio e a qualidade de produção.

2025-11-03T17:49:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Quantização para Modelos de Reconhecimento de Fala

A pesquisa melhora as técnicas de quantização pra aumentar a eficiência dos modelos de reconhecimento de fala.

2025-11-03T11:20:45+00:00 ― 9 min ler

Som Revolucionando a Medição de Qualidade de Áudio com PLCMOS

A PLCMOS oferece um jeito novo de avaliar a qualidade do som sem ouvintes humanos.

2025-11-03T10:32:10+00:00 ― 7 min ler

Interação Homem-Computador LoopBoxes: Uma Nova Maneira de Fazer Música

LoopBoxes ajuda as crianças a fazer música de um jeito fácil e colaborativo.

2025-11-03T08:55:00+00:00 ― 7 min ler

Som Síntese de Som Inovadora Usando Redes Neurais

Um novo método pra criar sons de impacto realistas usando redes neurais.

2025-11-03T08:06:25+00:00 ― 5 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala para Falantes Não Nativos

Nova técnica melhora sistemas de ASR para reconhecer melhor sotaques não nativos.

2025-11-03T02:26:20+00:00 ― 7 min ler

Processamento de Áudio e Fala Avançando o Reconhecimento de Fala com Aprendizado Fraco Supervisionado

Novos métodos aproveitam a identidade do falante pra melhorar o desempenho do reconhecimento de fala.

2025-11-03T01:37:45+00:00 ― 5 min ler

Som Melhorando o Reconhecimento de Fala com a Abordagem Sidecar

Um novo método combina reconhecimento de fala e identificação de falantes para fala sobreposta.

2025-11-03T00:49:10+00:00 ― 6 min ler

Computação e linguagem Avançando a Tradução Simultânea de fala com DiSeg

Um novo método melhora a qualidade e a eficiência da tradução em tempo real.

2025-11-03T00:00:35+00:00 ― 5 min ler

Computação e linguagem Melhorando o Aprendizado com Poucos Exemplos com Mecanismo de Atenção

Uma nova abordagem melhora o aprendizado de máquina com menos exemplos e dados multimodais.

2025-11-02T22:23:25+00:00 ― 6 min ler

Som Estimando Respostas ao Impulso de Ambientes com Múltiplas Fontes Sonoras

Um novo método para estimar as respostas de sala em ambientes sonoros complexos.

2025-11-02T21:34:50+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Conversão de Voz

Um novo método de conversão de voz melhora a clareza e a adaptação.

2025-11-02T19:57:40+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanço da Conversão de Texto em Fala para Línguas Turcas

Construindo sistemas de TTS para línguas turcas menos conhecidas usando dados do cazaque.

2025-11-02T18:20:30+00:00 ― 6 min ler

Som Apresentando o MeLoDy: Geração de Música Rápida Revelada

MeLoDy gera rapidamente música de alta qualidade a partir de prompts de texto.

2025-11-02T17:31:55+00:00 ― 6 min ler

Som Abordando Ameaças de Segurança em Sistemas de Reconhecimento de Voz

Novos métodos estão surgindo para proteger o reconhecimento de voz contra ataques adversariais.

2025-11-02T16:43:20+00:00 ― 6 min ler

Processamento de Áudio e Fala Apresentando o AudioDec: Uma Nova Era no Streaming de Áudio

AudioDec oferece áudio de alta qualidade em tempo real com baixo consumo de dados.

2025-11-02T15:06:10+00:00 ― 6 min ler

Som Novo método revela riscos de privacidade em modelos de difusão

Uma técnica nova verifica a exposição dos dados de treino em modelos de difusão.

2025-11-02T13:29:00+00:00 ― 6 min ler

Som Avanços na Separação de Voz com S4M

Um novo modelo melhora a isolação de voz em ambientes barulhentos.

2025-11-02T10:14:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Reproduzindo o som da fita magnética com ferramentas digitais

Esse artigo fala sobre como recriar o som de fita magnética usando tecnologia digital.

2025-11-02T09:26:05+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Síntese de Fala

Novo framework melhora a qualidade da geração de voz na síntese de fala.

2025-11-02T06:11:45+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços em Vozes Sintéticas Personalizadas

Pesquisadores desenvolvem tecnologia pra recriar vozes únicas pra quem tem dificuldades de fala.

2025-11-01T23:43:05+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Verificação de Fala com o Método OS-KDFT

Um novo método melhora a verificação de locutores ao combinar destilação de conhecimento e ajuste fino.

2025-11-01T22:05:55+00:00 ― 8 min ler

Processamento de Áudio e Fala DeCoR: Um Novo Método para Aprendizado de Áudio

DeCoR ajuda as máquinas a aprender novos sons sem esquecer os antigos.

2025-11-01T21:17:20+00:00 ― 6 min ler

Som Avanços na Marcação de Áudio em Tempo Real

Transformadores de áudio em streaming melhoram a velocidade e a eficiência nos sistemas de tagueamento de áudio.

2025-11-01T20:28:45+00:00 ― 7 min ler

Computação e linguagem Avanços nos Métodos de Transcrição de Fala

Novas técnicas melhoram a precisão e a velocidade na conversão de fala em texto.

2025-11-01T16:25:50+00:00 ― 6 min ler

Som Avaliando a Fala Disártrica: Novos Métodos para Clareza

Essa pesquisa apresenta avaliações melhoradas para uma comunicação mais clara em pessoas com disartria.

2025-11-01T15:37:15+00:00 ― 6 min ler

Som Abordando Desafios no Reconhecimento de Fala com Palavras Enarmônicas

Um novo método melhora o reconhecimento de voz para nomes que soam parecidos.

2025-11-01T14:48:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Diversidade de Fala em Sistemas TTS

Um novo método melhora a naturalidade e a variedade da saída de texto para fala.

2025-11-01T13:11:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Classificação de Áudio com o Adapter Treff

O adaptador Treff melhora a classificação de áudio com dados rotulados limitados.

2025-11-01T12:22:55+00:00 ― 6 min ler

Aprendizagem de máquinas Avanços em Aprendizado Auto-Supervisionado Multi-Tarefa

Novos métodos melhoram a flexibilidade e o desempenho do modelo em tarefas de áudio.

2025-11-01T08:20:00+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Emoções na Fala Usando Embeddings de Falantes

Pesquisas mostram métodos eficazes pra reconhecer emoções na fala usando embeddings.

2025-11-01T07:31:25+00:00 ― 6 min ler

Som Tagueamento de Áudio Eficiente com E-PANNs

Descubra como os E-PANNs melhoram a eficiência do reconhecimento de som.

2025-11-01T04:17:05+00:00 ― 6 min ler

Computação e linguagem Analisando Dialetos Através do Processamento de Áudio

Essa pesquisa analisa dialetos usando gravações de áudio pra mostrar as semelhanças entre eles.

2025-11-01T02:39:55+00:00 ― 6 min ler

Computação e linguagem Avançando a Compreensão da Linguagem Falada com Unidades Discretas

Novo método melhora a compreensão da linguagem falada sem precisar de transcrições escritas.

2025-11-01T00:14:10+00:00 ― 6 min ler