Engenharia Eletrotécnica e Ciência dos Sistemas - Processamento de Áudio e Fala

RSS

Processamento de Áudio e Fala Adaptação de Domínio Modular: Uma Nova Abordagem para Reconhecimento de Fala

A MDA melhora o reconhecimento de fala otimizando modelos para áreas de dados específicas.

2025-11-05T01:24:10+00:00 ― 6 min ler

Física médica Novo Estudo Liga Sinais do Cérebro ao Movimento da Língua

Pesquisas mostram que sinais do cérebro podem ajudar a prever os movimentos da língua durante a fala.

2025-11-04T23:54:21+00:00 ― 7 min ler

Som Avanços na Tecnologia de Texto para Fala com o U-DiT

O sistema U-DiT TTS melhora a geração de fala natural com uma arquitetura inovadora.

2025-11-04T23:47:00+00:00 ― 5 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala para Todos os Falantes

Um novo método busca melhorar os sistemas de ASR para pessoas com disartria.

2025-11-04T22:58:25+00:00 ― 6 min ler

Computação e linguagem Avanços em Aprender Palavras Faladas com MAMLCon

Um novo método melhora a compreensão dos computadores sobre comandos falados com menos exemplos.

2025-11-04T22:09:50+00:00 ― 5 min ler

Computação e linguagem Melhorando a Diarização de Falantes Usando Análise de Palavras

Melhorando a identificação de falantes ao combinar som e palavras faladas em áudio.

2025-11-04T18:55:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Adaptando Gestos para Agentes Virtuais

Agentes virtuais aprendem a imitar gestos humanos pra interagir melhor.

2025-11-04T18:06:55+00:00 ― 7 min ler

Som Simplificando a Síntese de Som com NAS-FM

Um novo método pra criar sintetizadores que beneficia os músicos.

2025-11-04T17:18:20+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Detecção de Falante Ativo

Um novo modelo melhora a detecção de falantes ativos usando pistas de áudio e visuais.

2025-11-04T16:29:45+00:00 ― 6 min ler

Som Fortalecendo a Verificação de Voz Contra Ameaças Avançadas

Uma olhada nos desafios e defesas em sistemas de verificação automática de fala.

2025-11-04T15:41:10+00:00 ― 5 min ler

Som O Papel das Redes Ópticas na Comunicação Moderna

Redes ópticas permitem transferências de dados rápidas, moldando o futuro da tecnologia de comunicação.

2025-11-04T14:04:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando Modelos de Áudio Geral para Tarefas de Fala

Um novo método melhora os modelos de áudio geral para reconhecimento de fala eficaz.

2025-11-04T05:58:10+00:00 ― 8 min ler

Computação e linguagem Avanços no Reconhecimento de Emoções em Conversas

Novo modelo melhora a compreensão emocional em diálogos.

2025-11-04T05:09:35+00:00 ― 8 min ler

Computação e linguagem Novo Modelo Melhora a Qualidade da Tradução de Fala

Um modelo combina linguagem falada e texto pra melhorar a precisão da tradução.

2025-11-04T04:21:00+00:00 ― 6 min ler

Aprendizagem de máquinas Estudando os Chamados dos Marmosets Através de Modelos de Fala Humana

A pesquisa usa modelos de fala humana pra analisar as vocalizações dos marmosets de forma eficaz.

2025-11-04T03:32:25+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Análise de Sons Pulmonares

Novos métodos melhoram a detecção precoce de doenças respiratórias usando dados sonoros.

2025-11-04T02:43:50+00:00 ― 6 min ler

Som Distinguindo entre risadas felizes e risadas zombeteiras

Esse estudo analisa como o riso transmite emoções através da análise do som.

2025-11-04T01:55:15+00:00 ― 5 min ler

Processamento de Áudio e Fala EfficientSpeech: Tecnologia de Texto para Fala no Dispositivo

Um novo modelo traz recursos de voz para dispositivos sem internet.

2025-11-04T01:06:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando a Compreensão da Linguagem Falada com Aprendizado Contínuo

Essa pesquisa aborda o esquecimento na IA por meio do aprendizado contínuo na compreensão da linguagem falada.

2025-11-04T00:18:05+00:00 ― 9 min ler

Som Avanços na Tecnologia de Texto-Para-Fala Emocional

O novo modelo ZET-Speech melhora a síntese de fala emocional para oradores diversos.

2025-11-03T23:29:30+00:00 ― 6 min ler

Som Avanços na Transcrição de Música de Piano e Violino

Estudo descobre que novas técnicas de mixagem melhoram a precisão da transcrição musical.

2025-11-03T21:52:20+00:00 ― 5 min ler

Som Avançando a Interação Humano-Máquina com Diálogo Empático

Um novo método melhora as respostas das máquinas através de uma melhor compreensão emocional.

2025-11-03T21:03:45+00:00 ― 7 min ler

Som Avançando o Reconhecimento de Fala em Configurações com Vários Falantes

Um novo método melhora a precisão no reconhecimento automático de voz em reuniões.

2025-11-03T20:15:10+00:00 ― 6 min ler

Som Desenvolvendo Assistentes de Voz Empáticos com CALLS

O CALLS tem como objetivo melhorar a capacidade dos assistentes de voz em lidar com interações com os clientes.

2025-11-03T19:26:35+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Preenchimento de Áudio

Novos métodos melhoram a restauração de áudio e a qualidade de produção.

2025-11-03T17:49:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Quantização para Modelos de Reconhecimento de Fala

A pesquisa melhora as técnicas de quantização pra aumentar a eficiência dos modelos de reconhecimento de fala.

2025-11-03T11:20:45+00:00 ― 9 min ler

Som Revolucionando a Medição de Qualidade de Áudio com PLCMOS

A PLCMOS oferece um jeito novo de avaliar a qualidade do som sem ouvintes humanos.

2025-11-03T10:32:10+00:00 ― 7 min ler

Interação Homem-Computador LoopBoxes: Uma Nova Maneira de Fazer Música

LoopBoxes ajuda as crianças a fazer música de um jeito fácil e colaborativo.

2025-11-03T08:55:00+00:00 ― 7 min ler

Som Síntese de Som Inovadora Usando Redes Neurais

Um novo método pra criar sons de impacto realistas usando redes neurais.

2025-11-03T08:06:25+00:00 ― 5 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala para Falantes Não Nativos

Nova técnica melhora sistemas de ASR para reconhecer melhor sotaques não nativos.

2025-11-03T02:26:20+00:00 ― 7 min ler

Processamento de Áudio e Fala Avançando o Reconhecimento de Fala com Aprendizado Fraco Supervisionado

Novos métodos aproveitam a identidade do falante pra melhorar o desempenho do reconhecimento de fala.

2025-11-03T01:37:45+00:00 ― 5 min ler

Som Melhorando o Reconhecimento de Fala com a Abordagem Sidecar

Um novo método combina reconhecimento de fala e identificação de falantes para fala sobreposta.

2025-11-03T00:49:10+00:00 ― 6 min ler

Computação e linguagem Avançando a Tradução Simultânea de fala com DiSeg

Um novo método melhora a qualidade e a eficiência da tradução em tempo real.

2025-11-03T00:00:35+00:00 ― 5 min ler

Computação e linguagem Melhorando o Aprendizado com Poucos Exemplos com Mecanismo de Atenção

Uma nova abordagem melhora o aprendizado de máquina com menos exemplos e dados multimodais.

2025-11-02T22:23:25+00:00 ― 6 min ler

Som Estimando Respostas ao Impulso de Ambientes com Múltiplas Fontes Sonoras

Um novo método para estimar as respostas de sala em ambientes sonoros complexos.

2025-11-02T21:34:50+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Conversão de Voz

Um novo método de conversão de voz melhora a clareza e a adaptação.

2025-11-02T19:57:40+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanço da Conversão de Texto em Fala para Línguas Turcas

Construindo sistemas de TTS para línguas turcas menos conhecidas usando dados do cazaque.

2025-11-02T18:20:30+00:00 ― 6 min ler

Som Apresentando o MeLoDy: Geração de Música Rápida Revelada

MeLoDy gera rapidamente música de alta qualidade a partir de prompts de texto.

2025-11-02T17:31:55+00:00 ― 6 min ler

Som Abordando Ameaças de Segurança em Sistemas de Reconhecimento de Voz

Novos métodos estão surgindo para proteger o reconhecimento de voz contra ataques adversariais.

2025-11-02T16:43:20+00:00 ― 6 min ler

Processamento de Áudio e Fala Apresentando o AudioDec: Uma Nova Era no Streaming de Áudio

AudioDec oferece áudio de alta qualidade em tempo real com baixo consumo de dados.

2025-11-02T15:06:10+00:00 ― 6 min ler