Artigos mais recentes para Processamento de Áudio

Aprendizagem de máquinas Desafios em Usar Convnets para Design de Filtros de Áudio

Este estudo explora problemas com o uso de convnets para a criação de filtro de áudio.

2025-09-14T14:34:35+00:00 ― 6 min ler

Som Avanços em Modelos de Áudio e Linguagem

O modelo CLAP conecta o processamento de áudio e texto pra várias aplicações.

2025-09-14T13:46:00+00:00 ― 5 min ler

Som Novo sistema melhora a extração de voz de posições de cabeça instáveis

A PIAVE ajuda máquinas a captar vozes com clareza, mesmo quando as pessoas viram a cabeça.

2025-09-12T19:39:40+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando a Clareza da Fala com a Tecnologia AV2Wav

O AV2Wav melhora a qualidade da fala usando dicas sonoras e visuais.

2025-09-12T17:13:55+00:00 ― 6 min ler

Som Uma Nova Estrutura para Anonimização de Locutores

Apresentando uma estrutura flexível para aprimorar a pesquisa em privacidade de voz.

2025-09-12T05:05:10+00:00 ― 8 min ler

Som Desafios Emocionais Afetam Modelos de Separação de Fala

Pesquisas mostram que a fala emocional afeta o desempenho do modelo em tarefas de separação de fala.

2025-09-11T18:33:35+00:00 ― 7 min ler

Processamento de Áudio e Fala Avançando Técnicas de Detecção de Fala Falsa

Novos métodos estão melhorando nossa habilidade de detectar discursos falsos de forma eficaz.

2025-09-11T02:21:55+00:00 ― 6 min ler

Som Melhorando o Treinamento de Vocoders com Aprendizado Contrastivo

Novos métodos melhoram o desempenho de vocoder com dados de áudio limitados.

2025-09-10T12:36:00+00:00 ― 6 min ler

Som Um Novo Método para Detectar Spoofing de Voz

Uma maneira firme de identificar anomalias de áudio e combater a falsificação de voz.

2025-09-09T07:27:00+00:00 ― 6 min ler

Som DiCon: Uma Nova Abordagem para Síntese de Fala

Apresentando um método mais rápido para síntese de fala de alta qualidade usando modelos de difusão.

2025-09-09T03:24:05+00:00 ― 7 min ler

Processamento de Áudio e Fala HiFTNet: Avançando a Tecnologia de Texto para Fala

HiFTNet oferece uma síntese de fala mais rápida e de alta qualidade usando técnicas inovadoras e eficientes.

2025-09-09T02:35:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Apresentando o AV-SUPERB: Um Novo Padrão para Modelos Audiovisuais

AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.

2025-09-08T22:32:35+00:00 ― 6 min ler

Som Geração de Texto pra Áudio Mais Rápida Usando Destilação de Consistência

Nova metodologia melhora a velocidade e eficiência na geração de Texto para Áudio.

2025-09-08T18:29:40+00:00 ― 5 min ler

Processamento de Áudio e Fala Apresentando o Modelo SPGM para Separação de Fala

Um novo modelo melhora a eficiência e o desempenho na separação de fala.

2025-09-07T10:54:55+00:00 ― 6 min ler

Som Método inovador transforma legendagem de áudio com dados de texto

Uma nova abordagem gera legendas de áudio usando apenas texto, melhorando a eficiência dos dados.

2025-09-07T00:23:20+00:00 ― 8 min ler

Som Conectando Música: Recuperação de Áudio e Partitura

Explorando os desafios e inovações em fazer a correspondência entre gravações de áudio e partituras.

2025-09-06T21:57:35+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando Conjuntos de Dados de Áudio com K-Means Clustering

Usando agrupamento k-means pra otimizar dados de áudio e treinar o modelo melhor.

2025-09-06T15:28:55+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Técnicas de Aumento de Áudio

Estudo mostra que a augmentação de áudio pode melhorar o reconhecimento de fala em línguas de baixo recurso.

2025-09-06T09:48:50+00:00 ― 6 min ler

Aprendizagem de máquinas Melhorando o Aprendizado com Rótulos Fracos Através da Seleção de Exemplos Negativos

Novas estratégias melhoram o aprendizado com rótulos fracos ao selecionar exemplos negativos relevantes.

2025-09-06T04:57:20+00:00 ― 7 min ler

Processamento de Áudio e Fala Seleção Eficiente de Modelos para Reconhecimento de Fala

Um método pra escolher o melhor modelo de ASR baseado nas características do áudio.

2025-09-05T23:17:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Clareza da Fala com Técnicas de Dereverberação

Saiba como a desreverberação melhora o reconhecimento de fala em ambientes barulhentos.

2025-09-05T12:45:40+00:00 ― 5 min ler

Processamento de Áudio e Fala Novo Método para Estimativa de Volume de Cômodos Usando Modelos de Atenção

Esse estudo apresenta um modelo baseado em atenção pra estimar volumes de cômodos a partir de gravações de áudio.

2025-09-05T11:08:30+00:00 ― 6 min ler

Som Apresentando o ASCA: Uma Nova Abordagem para Classificação de Áudio

O modelo ASCA melhora a precisão da classificação de áudio para conjuntos de dados pequenos.

2025-09-05T10:19:55+00:00 ― 7 min ler

Som Transformando Movimentos da Língua em Sons da Fala

Este estudo transforma dados de ressonância magnética da língua em áudio de fala real.

2025-09-04T22:11:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços e Desafios nos Modelos de Reconhecimento de Fala

Este estudo analisa como a compressão de modelos afeta o reconhecimento de fala em ambientes barulhentos.

2025-09-04T19:45:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Detecção de Eventos Sonoros com OAL

Explore como o Aprendizado Ativo Online melhora a eficiência do reconhecimento de sons.

2025-09-04T18:56:50+00:00 ― 7 min ler

Som Avanços em Modelos de Reconhecimento de Áudio e Fala

Um novo modelo melhora a compreensão da fala e dos sons ao mesmo tempo.

2025-09-04T18:08:15+00:00 ― 6 min ler

Som Avanços na Classificação de Áudio Usando DCLS

DCLS melhora o desempenho na classificação de áudio aprendendo as posições do núcleo durante o treinamento.

2025-09-04T07:36:40+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Melhorando o Aprendizado Audiovisual com Co-Aumentação de Velocidade

Um novo método melhora o aprendizado de máquina de dados áudio-visuais.

2025-09-04T05:59:30+00:00 ― 6 min ler

Processamento de Áudio e Fala MC-SimCLR: Avançando o Aprendizado Sonoro e a Consciência de Localização

Um novo método melhora o reconhecimento de som e a localização da fonte sem precisar de rótulos.

2025-09-03T00:50:30+00:00 ― 6 min ler

Som Novas Perspectivas sobre Generalização em Redes Neurais

Explorando como a nitidez dos mínimos influencia o desempenho do modelo em dados de áudio não vistos.

2025-09-02T15:56:05+00:00 ― 6 min ler

Som Transformers na Aprendizagem de Representação Musical

Um estudo sobre como usar transformers para uma boa marcação e representação de música.

2025-09-02T07:01:40+00:00 ― 8 min ler

Processamento de Áudio e Fala Uma Abordagem Universal para Melhoria de Fala

Essa pesquisa apresenta um modelo pra melhorar a clareza da fala em diferentes condições.

2025-09-02T02:10:10+00:00 ― 6 min ler

Som A Ascensão da Legendação Automática de Áudio

Explorando os avanços na legendagem automática de áudio e seu impacto na acessibilidade.

2025-09-02T01:21:35+00:00 ― 5 min ler

Som Avanços nas Técnicas de Conexão Texto-a-Áudio

Novos métodos melhoram a ligação entre descrições de texto e eventos sonoros.

2025-08-31T16:09:40+00:00 ― 8 min ler

Processamento de Áudio e Fala Avanços na Diarização de Falantes com o Método E-SHARC

O E-SHARC melhora a identificação de falantes em vários ambientes de áudio.

2025-08-28T06:22:45+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avançando a Segmentação Audiovisual com Técnicas Não Supervisionadas

Uma nova abordagem simplifica a segmentação audio-visual sem precisar de dados rotulados caros.

2025-08-27T01:00:18+00:00 ― 8 min ler

Processamento de Áudio e Fala Novo Método para Limpar Discurso Ecoado

Um método melhora a clareza da fala em ambientes barulhentos sem dados de treinamento claros.

2025-08-26T17:56:30+00:00 ― 7 min ler

Análise Funcional Wavelets e Suavidade: Uma Visão Prática

Explore o papel das wavelets na análise da suavidade de funções e suas aplicações.

2025-08-24T23:53:28+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Diarização de Falantes com Abordagens de Múltiplos Microfones

Novos métodos melhoram a detecção de atividade de voz e sobreposição na diarização de falantes.

2025-08-24T13:18:35+00:00 ― 8 min ler