Novos métodos melhoram a detecção precoce de problemas de voz usando características da fonte glotal.

2025-09-04T10:02:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala para Acentos Diversos

Melhorando modelos de fala pra reconhecer e se adaptar melhor a diferentes sotaques.

2025-09-04T08:25:15+00:00 ― 5 min ler

Som Avanços na Classificação de Áudio Usando DCLS

DCLS melhora o desempenho na classificação de áudio aprendendo as posições do núcleo durante o treinamento.

2025-09-04T07:36:40+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Melhorando o Aprendizado Audiovisual com Co-Aumentação de Velocidade

Um novo método melhora o aprendizado de máquina de dados áudio-visuais.

2025-09-04T05:59:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Extração de Fala

Apresentando novos modelos pra melhorar a extração de fala em ambientes barulhentos.

2025-09-04T02:45:10+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Adaptação de Baixa Classificação

Um novo método melhora a eficiência do reconhecimento de fala usando adaptação de baixo rank.

2025-09-04T00:19:25+00:00 ― 6 min ler

Processamento de Sinal Uma Nova Abordagem para Identificar Sintomas de Esquizofrenia

Juntando áudio, vídeo e texto pra melhorar as avaliações de saúde mental.

2025-09-03T22:42:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Novas Técnicas

Uma olhada nas melhorias em reconhecimento de fala pra aumentar a velocidade e a precisão.

2025-09-03T21:05:05+00:00 ― 6 min ler

Computação e linguagem Ligando as lacunas de idioma na saúde

Melhorando a comunicação entre médico e paciente com tecnologias avançadas de reconhecimento de voz.

2025-09-03T18:39:20+00:00 ― 7 min ler

Som A Melodia da Synthia: Uma Nova Ferramenta para Pesquisa de Áudio

A Melodia da Synthia ajuda os pesquisadores a testarem modelos de áudio com dados variados.

2025-09-03T14:36:25+00:00 ― 6 min ler

Computação e linguagem Enfrentando Desafios no Reconhecimento Automático de Fala de Longo Prazo

A pesquisa foca em melhorar os sistemas de ASR para áudio não segmentado.

2025-09-03T13:47:50+00:00 ― 5 min ler

Processamento de Áudio e Fala Avançando a Síntese Vocal para Áudio Realista

A pesquisa foca em otimizar sintetizadores para vocalizações humanas em diferentes mídias.

2025-09-03T09:44:55+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Verificação de Fala: Lidando com a Variabilidade de Sessões

Um novo método melhora a verificação de falantes gerenciando a variabilidade das sessões de forma eficaz.

2025-09-03T08:56:20+00:00 ― 7 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Grandes Modelos de Linguagem

Os LLMs melhoram a precisão e a correção de erros em sistemas de reconhecimento de fala.

2025-09-03T06:30:35+00:00 ― 6 min ler

Processamento de Áudio e Fala MC-SimCLR: Avançando o Aprendizado Sonoro e a Consciência de Localização

Um novo método melhora o reconhecimento de som e a localização da fonte sem precisar de rótulos.

2025-09-03T00:50:30+00:00 ― 6 min ler

Computação e linguagem HyPoradise: Aumentando a Precisão do Reconhecimento Automático de Fala

Um novo padrão pra melhorar a precisão do ASR usando modelos de linguagem.

2025-09-02T23:13:20+00:00 ― 7 min ler

Computação e linguagem Avanços na Tradução de Fala Através do Contexto

Novos métodos melhoram a tradução de fala ao focar em informações contextuais.

2025-09-02T22:24:45+00:00 ― 6 min ler

Som Avançando a Tecnologia de Voz com Dados de Código de Mistura

Um novo método melhora o reconhecimento de voz para usuários que alternam entre idiomas.

2025-09-02T21:36:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Aproveitando a Detecção de Sons Anômalos para Resultados Melhores

Aprenda como a análise de som ajuda a identificar problemas em máquinas de forma eficiente.

2025-09-02T20:47:35+00:00 ― 6 min ler

Computação e linguagem Avanços na Tradução de Fala e Legendas

Esse projeto melhora a tradução de fala em tempo real e os sistemas automáticos de legendagem.

2025-09-02T18:21:50+00:00 ― 4 min ler

Som Novas Perspectivas sobre Generalização em Redes Neurais

Explorando como a nitidez dos mínimos influencia o desempenho do modelo em dados de áudio não vistos.

2025-09-02T15:56:05+00:00 ― 6 min ler

Som Combinando Voz e Rosto pra Uma Identificação Melhor

Novo método melhora a verificação de falantes ao combinar dados de áudio e visuais.

2025-09-02T07:50:15+00:00 ― 6 min ler

Som Transformers na Aprendizagem de Representação Musical

Um estudo sobre como usar transformers para uma boa marcação e representação de música.

2025-09-02T07:01:40+00:00 ― 8 min ler

Multimédia Avanços na Localização de Alto-falantes Audiovisuais

Um novo método melhora o rastreamento de falantes usando dados de áudio e vídeo.

2025-09-02T06:13:05+00:00 ― 7 min ler

Som Novo Método para Analisar a Dificuldade da Música de Piano

Uma nova maneira de avaliar a dificuldade de música para piano usando imagens de partituras.

2025-09-02T05:24:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando as Transcrições de Reuniões com o Sistema PP-MeT

O PP-MeT quer melhorar a precisão na transcrição de reuniões com várias pessoas.

2025-09-02T04:35:55+00:00 ― 5 min ler

Processamento de Áudio e Fala Uma Abordagem Universal para Melhoria de Fala

Essa pesquisa apresenta um modelo pra melhorar a clareza da fala em diferentes condições.

2025-09-02T02:10:10+00:00 ― 6 min ler

Som A Ascensão da Legendação Automática de Áudio

Explorando os avanços na legendagem automática de áudio e seu impacto na acessibilidade.

2025-09-02T01:21:35+00:00 ― 5 min ler

Som Separação de Fala Inovadora Usando Dados Auditivos e Visuais

A pesquisa apresenta um método eficaz para melhorar a clareza da fala em ambientes barulhentos.

2025-09-02T00:33:00+00:00 ― 8 min ler

Aprendizagem de máquinas Aprimorando a Combinação de Estilo de Áudio com Efeitos Tradicionais

Um novo método simplifica a transferência de estilo de áudio usando efeitos não diferenciáveis.

2025-09-01T19:41:30+00:00 ― 8 min ler

Som Avaliando a Qualidade de Performances de Piano Geradas por Computador

A pesquisa analisa como a música feita por computador se compara à performance humana por meio de testes de audição.

2025-09-01T07:32:45+00:00 ― 8 min ler

Processamento de Áudio e Fala Melhorando o Design de Som com Polinômios Ultrasféricos

Saiba como os polinômios ultrasféricos melhoram a tecnologia de áudio e a direcionalidade do som.

2025-09-01T05:55:35+00:00 ― 7 min ler

Processamento de Áudio e Fala Avançando o Reconhecimento de Voz com SSRL

Um novo método melhora o reconhecimento de voz usando menos rótulos e recursos.

2025-09-01T00:15:30+00:00 ― 8 min ler

Som Avanços nas Técnicas de Conexão Texto-a-Áudio

Novos métodos melhoram a ligação entre descrições de texto e eventos sonoros.

2025-08-31T16:09:40+00:00 ― 8 min ler

Processamento de Áudio e Fala Detecção de Direção do Som em Robôs em Movimento

Métodos inovadores melhoram como os robôs processam a direção do som enquanto estão em movimento.

2025-08-31T14:32:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Beamforming

Aprenda sobre beamforming com valores reais e seus benefícios para arrays de microfone.

2025-08-31T12:06:45+00:00 ― 6 min ler

Som Um Novo Modelo para Geração de Música com IA

MusicAOG simplifica a criação e a compreensão da música através de uma representação gráfica inovadora.

2025-08-31T08:52:25+00:00 ― 7 min ler

Processamento de Áudio e Fala Projetando Sistemas MIMO Eficazes com Redes Esféricas

Um novo framework pra combinar arrays de microfones e alto-falantes esféricos em estudos sonoros.

2025-08-31T07:15:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Projetando Sistemas de Audição Eficazes para Robôs Humanoides

Um novo framework pra melhorar a detecção de som em robôs humanoides através do design de arranjos de microfone.

2025-08-31T06:26:40+00:00 ― 9 min ler

Processamento de Áudio e Fala Melhorando a Acústica de Ambientes com Sistemas MIMO

Descubra como os sistemas MIMO melhoram a análise de som em vários ambientes.

2025-08-31T02:23:45+00:00 ― 8 min ler

Informática - Som