Cleancoder melhora os sistemas de ASR reduzindo o barulho de fundo pra entender a fala melhor.

2025-09-16T21:38:15+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões RÁDIO: Uma Nova Maneira de Falar com a Galera

RADIO cria rostos falantes realistas usando só uma imagem de referência.

2025-09-16T16:46:45+00:00 ― 7 min ler

Computação e linguagem RoDia: Um Novo Conjunto de Dados para Identificação de Dialetos Rumanos

RoDia oferece amostras de áudio essenciais pra identificar dialetos romenos.

2025-09-16T15:58:10+00:00 ― 6 min ler

Processamento de Áudio e Fala O Papel dos Sinais Não Verbais na Comunicação

Explorando como gestos e expressões melhoram nossa compreensão da linguagem falada.

2025-09-16T08:40:55+00:00 ― 8 min ler

Processamento de Áudio e Fala Avanços na Detecção e Localização de Eventos Sonoros

Explorando novos métodos de detecção e localização de som usando dados sintéticos.

2025-09-16T05:26:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Sistema de Simulação de Som para Músicos

Um novo sistema ajuda músicos a vivenciar o som em um palco virtual.

2025-09-16T03:00:50+00:00 ― 7 min ler

Som Avanços na Detecção de Áudio Parcialmente Falsificado

Novo método melhora a detecção de trechos de áudio falsos em gravações.

2025-09-16T01:23:40+00:00 ― 6 min ler

Som Avanços na Tecnologia Musical: Separando Ritmo e Harmonia

Os computadores estão aprendendo a separar ritmo e harmonia na música para aplicações criativas.

2025-09-15T23:46:30+00:00 ― 4 min ler

Processamento de Áudio e Fala MuLanTTS: Uma Nova Fronteira em Texto para Fala

O MuLanTTS da Microsoft oferece capacidades de texto-para-fala em francês de forma natural e expressiva.

2025-09-15T22:57:55+00:00 ― 5 min ler

Som Avanços na Tecnologia de Monitoramento de Tráfego Acústico

Novos conjuntos de dados e métodos melhoram a classificação de veículos para uma gestão de trânsito melhor.

2025-09-15T13:14:55+00:00 ― 7 min ler

Som Avanços em Sistemas de Reconhecimento Automático de Fala

Novos métodos melhoram a precisão e a velocidade na tecnologia de reconhecimento de fala.

2025-09-15T06:46:15+00:00 ― 7 min ler

Som Avanços na Sintetização de Som Foley com Aprendizado de Máquina

Um novo sintetizador melhora a geração de efeitos sonoros realistas para a mídia.

2025-09-15T05:57:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando a Estimativa de Confiança em Reconhecimento Automático de Fala

Uma nova abordagem melhora a estimativa de confiança em sistemas de ASR para uma precisão melhor.

2025-09-15T03:14:28+00:00 ― 5 min ler

Som Avanços na Tecnologia de Geração de Fala

Apresentando uma estrutura para uma síntese de fala mais natural e expressiva.

2025-09-15T01:06:10+00:00 ― 7 min ler

Som Classificando Gêneros Musicais com Tecnologia

Aprenda como a tecnologia ajuda a categorizar gêneros musicais de forma eficiente.

2025-09-14T21:51:50+00:00 ― 7 min ler

Som Novo Modelo Melhora Avaliação da Intensidade de Alimentação de Peixes

Uma abordagem unificada pra avaliar a alimentação dos peixes usando dados de áudio e vídeo.

2025-09-14T21:03:15+00:00 ― 6 min ler

Som Avanços na Tecnologia de Cabeça Falante Emocional

Um novo método melhora a criação de vídeos de talking-head que expressam emoções.

2025-09-14T15:23:10+00:00 ― 8 min ler

Aprendizagem de máquinas Desafios em Usar Convnets para Design de Filtros de Áudio

Este estudo explora problemas com o uso de convnets para a criação de filtro de áudio.

2025-09-14T14:34:35+00:00 ― 6 min ler

Som Avanços em Modelos de Áudio e Linguagem

O modelo CLAP conecta o processamento de áudio e texto pra várias aplicações.

2025-09-14T13:46:00+00:00 ― 5 min ler

Computação e linguagem Avanços em Aprendizado Auto-Supervisionado para Tecnologias de Fala em Francês

Um projeto tem como objetivo melhorar o processamento de fala em francês usando aprendizado auto-supervisionado.

2025-09-14T12:57:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Anotação Automática de Prosódia

Novos métodos melhoram como as máquinas reconhecem o ritmo da fala e a emoção.

2025-09-14T12:08:50+00:00 ― 7 min ler

Som Novo Método para Estimativa de Som em Ambientes Dispersos

Uma nova abordagem melhora a estimativa de som em espaços com objetos que refletem.

2025-09-14T06:28:45+00:00 ― 6 min ler

Som O Impacto da Indecidibilidade na Produção Musical

Analisa como a indecidibilidade influencia a composição musical e a produção hoje em dia.

2025-09-14T05:40:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Melhorando a Diarização de Falantes com Modelos de Linguagem

Esse artigo explora avanços na diarização de falantes usando modelos de linguagem pra ter mais precisão.

2025-09-14T03:14:25+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços no Reconhecimento de Fala para Crianças

Esse estudo melhora a capacidade dos sistemas de ASR em reconhecer a fala das crianças.

2025-09-14T02:25:50+00:00 ― 7 min ler

Processamento de Áudio e Fala O Papel do Áudio na Detecção de Pedestres

Pesquisadores estão explorando a tecnologia de detecção de áudio para melhorar a identificação de pedestres em áreas urbanas.

2025-09-14T00:48:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços nas Técnicas de Gravação de Campo Sonoro

Novo método melhora a localização de fonte sonora e separação de campo.

2025-09-13T20:45:45+00:00 ― 7 min ler

Som Avanços na Sintetização de Sons Percussivos

Um novo método melhora a síntese do som de bateria focando em elementos transientes agudos.

2025-09-13T19:57:10+00:00 ― 6 min ler

Som Criando Conjuntos de Dados de Voz Sintética que Respeitam a Privacidade

Pesquisadores estão criando dados de voz sintética pra proteger a privacidade no reconhecimento de voz.

2025-09-13T15:05:40+00:00 ― 7 min ler

Processamento de Áudio e Fala VoxtLM: Uma Abordagem Unificada para Fala e Texto

VoxtLM combina reconhecimento de fala, síntese, geração de texto e continuação em um só modelo.

2025-09-13T11:02:45+00:00 ― 5 min ler

Processamento de Áudio e Fala PromptASR: Tecnologia de Reconhecimento de Fala de Outro Nível

Novo sistema melhora o reconhecimento de fala usando prompts que levam em conta o contexto.

2025-09-13T10:14:10+00:00 ― 5 min ler

Som Avanços nos Modelos de Áudio Universal

EnCodecMAE combina aprendizado auto-supervisionado e codecs de áudio pra melhorar o desempenho em tarefas de áudio.

2025-09-13T09:25:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando o Diagnóstico do Autismo Através do Reconhecimento de Som

Um estudo sobre como usar aprendizado de máquina pra identificar os sons das crianças na avaliação do TEA.

2025-09-13T07:48:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Uma Nova Abordagem para Identificação de Palavras-Chave

Apresentando um método flexível para reconhecer palavras-chave na fala em diferentes idiomas.

2025-09-13T06:11:15+00:00 ― 7 min ler

Processamento de Áudio e Fala Avaliando a Qualidade do Fala na Comunicação Áudio

Um olhar sobre como a qualidade da fala é testada usando crowdsourcing.

2025-09-13T05:22:40+00:00 ― 6 min ler

Som Novos Métodos para Detectar Áudio Gerado por IA

Técnicas avançadas pra garantir a autenticidade do áudio na era da clonagem de voz.

2025-09-13T03:40:24+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Legenda de Áudio com Treinamento Só de Texto

Um novo método treina sistemas de legendagem de áudio usando só descrições em texto.

2025-09-13T02:56:55+00:00 ― 7 min ler

Som Passos Essenciais para Escrever Trabalhos Acadêmicos

Um guia pra fazer trabalhos acadêmicos claros e eficazes.

2025-09-13T01:19:45+00:00 ― 4 min ler

Interação Homem-Computador Erie: Uma Nova Ferramenta para Sonificação de Dados

A Erie facilita transformar dados em som pra ter uma acessibilidade melhor.

2025-09-13T00:22:54+00:00 ― 8 min ler

Criptografia e segurança Ataques de Backdoor: Uma Ameaça Oculta para a Verificação de Voz

Examinando os riscos de ataques via backdoor em sistemas de verificação de voz.

2025-09-12T22:54:00+00:00 ― 8 min ler

Informática - Som