Engenharia Eletrotécnica e Ciência dos Sistemas - Processamento de Áudio e Fala

RSS

Computação e linguagem Avanços na Tradução de Fala Através do Contexto

Novos métodos melhoram a tradução de fala ao focar em informações contextuais.

2025-09-02T22:24:45+00:00 ― 6 min ler

Som Avançando a Tecnologia de Voz com Dados de Código de Mistura

Um novo método melhora o reconhecimento de voz para usuários que alternam entre idiomas.

2025-09-02T21:36:10+00:00 ― 5 min ler

Processamento de Áudio e Fala Aproveitando a Detecção de Sons Anômalos para Resultados Melhores

Aprenda como a análise de som ajuda a identificar problemas em máquinas de forma eficiente.

2025-09-02T20:47:35+00:00 ― 6 min ler

Computação e linguagem Avanços na Tradução de Fala e Legendas

Esse projeto melhora a tradução de fala em tempo real e os sistemas automáticos de legendagem.

2025-09-02T18:21:50+00:00 ― 4 min ler

Som Novas Perspectivas sobre Generalização em Redes Neurais

Explorando como a nitidez dos mínimos influencia o desempenho do modelo em dados de áudio não vistos.

2025-09-02T15:56:05+00:00 ― 6 min ler

Som Combinando Voz e Rosto pra Uma Identificação Melhor

Novo método melhora a verificação de falantes ao combinar dados de áudio e visuais.

2025-09-02T07:50:15+00:00 ― 6 min ler

Som Transformers na Aprendizagem de Representação Musical

Um estudo sobre como usar transformers para uma boa marcação e representação de música.

2025-09-02T07:01:40+00:00 ― 8 min ler

Multimédia Avanços na Localização de Alto-falantes Audiovisuais

Um novo método melhora o rastreamento de falantes usando dados de áudio e vídeo.

2025-09-02T06:13:05+00:00 ― 7 min ler

Som Novo Método para Analisar a Dificuldade da Música de Piano

Uma nova maneira de avaliar a dificuldade de música para piano usando imagens de partituras.

2025-09-02T05:24:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando as Transcrições de Reuniões com o Sistema PP-MeT

O PP-MeT quer melhorar a precisão na transcrição de reuniões com várias pessoas.

2025-09-02T04:35:55+00:00 ― 5 min ler

Processamento de Áudio e Fala Uma Abordagem Universal para Melhoria de Fala

Essa pesquisa apresenta um modelo pra melhorar a clareza da fala em diferentes condições.

2025-09-02T02:10:10+00:00 ― 6 min ler

Som A Ascensão da Legendação Automática de Áudio

Explorando os avanços na legendagem automática de áudio e seu impacto na acessibilidade.

2025-09-02T01:21:35+00:00 ― 5 min ler

Som Separação de Fala Inovadora Usando Dados Auditivos e Visuais

A pesquisa apresenta um método eficaz para melhorar a clareza da fala em ambientes barulhentos.

2025-09-02T00:33:00+00:00 ― 8 min ler

Aprendizagem de máquinas Aprimorando a Combinação de Estilo de Áudio com Efeitos Tradicionais

Um novo método simplifica a transferência de estilo de áudio usando efeitos não diferenciáveis.

2025-09-01T19:41:30+00:00 ― 8 min ler

Som Avaliando a Qualidade de Performances de Piano Geradas por Computador

A pesquisa analisa como a música feita por computador se compara à performance humana por meio de testes de audição.

2025-09-01T07:32:45+00:00 ― 8 min ler

Processamento de Áudio e Fala Melhorando o Design de Som com Polinômios Ultrasféricos

Saiba como os polinômios ultrasféricos melhoram a tecnologia de áudio e a direcionalidade do som.

2025-09-01T05:55:35+00:00 ― 7 min ler

Processamento de Áudio e Fala Avançando a Reconstrução de Campo Sonoro com IA

Usando IA pra melhorar como a gente recria som em diferentes ambientes.

2025-09-01T01:52:40+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando o Reconhecimento de Voz com SSRL

Um novo método melhora o reconhecimento de voz usando menos rótulos e recursos.

2025-09-01T00:15:30+00:00 ― 8 min ler

Som Avanços nas Técnicas de Conexão Texto-a-Áudio

Novos métodos melhoram a ligação entre descrições de texto e eventos sonoros.

2025-08-31T16:09:40+00:00 ― 8 min ler

Processamento de Áudio e Fala Detecção de Direção do Som em Robôs em Movimento

Métodos inovadores melhoram como os robôs processam a direção do som enquanto estão em movimento.

2025-08-31T14:32:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Beamforming

Aprenda sobre beamforming com valores reais e seus benefícios para arrays de microfone.

2025-08-31T12:06:45+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços em Modelos de Texto-para-Fala Conversacional

Uma nova abordagem para a geração de fala pequena, eficiente e com som natural.

2025-08-31T09:41:00+00:00 ― 10 min ler

Som Um Novo Modelo para Geração de Música com IA

MusicAOG simplifica a criação e a compreensão da música através de uma representação gráfica inovadora.

2025-08-31T08:52:25+00:00 ― 7 min ler

Processamento de Áudio e Fala Projetando Sistemas MIMO Eficazes com Redes Esféricas

Um novo framework pra combinar arrays de microfones e alto-falantes esféricos em estudos sonoros.

2025-08-31T07:15:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Projetando Sistemas de Audição Eficazes para Robôs Humanoides

Um novo framework pra melhorar a detecção de som em robôs humanoides através do design de arranjos de microfone.

2025-08-31T06:26:40+00:00 ― 9 min ler

Processamento de Áudio e Fala Melhorando a Acústica de Ambientes com Sistemas MIMO

Descubra como os sistemas MIMO melhoram a análise de som em vários ambientes.

2025-08-31T02:23:45+00:00 ― 8 min ler

Processamento de Áudio e Fala Avanços na Pesquisa de Acústica de Salas

Novas técnicas melhoram a estimativa de direção do som para vários tipos de áudio.

2025-08-31T01:35:10+00:00 ― 6 min ler

Processamento de Áudio e Fala Controlando o Som pra Ouvir Melhor

Pesquisas mostram maneiras de ajustar o som nos cômodos pra melhorar a clareza.

2025-08-31T00:46:35+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Detectando Humor em Vídeos com o FunnyNet-W

Um novo modelo identifica momentos engraçados em vídeos usando dados visuais, de áudio e de texto.

2025-08-30T23:09:25+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços em Elastômeros Dielétricos para Tecnologia

Elastômeros dielétricos transformam energia elétrica em movimento mecânico, oferecendo várias aplicações.

2025-08-30T20:43:40+00:00 ― 9 min ler

Computação e linguagem Usando a tecnologia ASR pra ajudar no diagnóstico de demência

Transcrições de ASR com erros podem ajudar a identificar o Alzheimer de forma mais precisa.

2025-08-30T16:40:45+00:00 ― 9 min ler

Computação e linguagem Apresentando ELLA-V: Um Novo Capítulo na Síntese de Fala

A ELLA-V melhora a qualidade e o controle de texto para fala, superando os modelos anteriores.

2025-08-30T01:17:40+00:00 ― 6 min ler

Métodos Quantitativos Novo Método Melhora Monitoramento Acústico da Vida Selvagem

Uma nova abordagem melhora a precisão na detecção de chamados de animais sem limites arbitrários.

2025-08-29T23:46:39+00:00 ― 8 min ler

Computação e linguagem Avançando a Classificação de Fala com Dados Multimodais

Um novo modelo integra áudio e texto pra melhorar a classificação da fala.

2025-08-29T18:49:00+00:00 ― 8 min ler

Som Desafio NOTSOFAR-1: Avançando a Tecnologia de Transcrição de Reuniões

Uma nova iniciativa pra melhorar a tecnologia de transcrição em reuniões em salas grandes.

2025-08-29T16:23:15+00:00 ― 9 min ler

Computação e linguagem Avanços na Correção de Erros de Reconhecimento de Fala

Novos métodos melhoram a precisão no reconhecimento de fala ruidosa usando grandes modelos de linguagem.

2025-08-29T01:48:45+00:00 ― 7 min ler

Som Entendendo os Sons das Galinhas Poedeiras para uma Agricultura Melhor

Analisar os sons das galinhas ajuda a melhorar a saúde delas e a produtividade da fazenda.

2025-08-29T00:11:35+00:00 ― 9 min ler

Interação Homem-Computador Desmistificando o Som: Uma Nova Ferramenta pra Realidade Misturada

Um método pra ajudar pessoas com deficiência visual a reconhecer sons na realidade mista.

2025-08-28T20:57:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Abordando os Desafios da Tecnologia de Fala para Línguas com Poucos Recursos

Este artigo fala sobre soluções para aplicativos de fala em idiomas com dados transcritos limitados.

2025-08-28T18:31:30+00:00 ― 7 min ler

Aprendizagem de máquinas Avanços na Classificação de Som Usando Redes de Crença Projetadas

Pesquisadores combinam métodos generativos e discriminativos pra melhorar a classificação de sons.

2025-08-28T16:05:45+00:00 ― 7 min ler