Engenharia Eletrotécnica e Ciência dos Sistemas - Processamento de Áudio e Fala

RSS

Processamento de Áudio e Fala Avanços no Reconhecimento de Emoções na Fala com Modelos Pré-treinados

Descubra como modelos pré-treinados melhoram a tecnologia de reconhecimento de emoções na fala.

2025-11-18T06:48:50+00:00 ― 8 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Transformação de Textura de Áudio

Um novo método melhora a transformação de textura de áudio para design sonoro criativo.

2025-11-17T21:05:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando a Criação de Áudio através de Descrições de Texto

Um novo método gera áudio a partir de texto usando modelos modernos.

2025-11-17T15:25:45+00:00 ― 6 min ler

Som DCASE 2023: Avançando a Síntese Automática de Sons Foley

Uma competição pra melhorar a criação automática de sons Foley pra multimídia.

2025-11-17T14:37:10+00:00 ― 6 min ler

Som Avançando a Classificação de Música com Playlists

Este estudo explora como usar playlists pra melhorar a classificação e similaridade de músicas.

2025-11-17T10:34:15+00:00 ― 5 min ler

Processamento de Áudio e Fala Avançando na Detecção de Som com Aprendizado Semi-Supervisionado

Um novo método melhora a detecção de som usando dados rotulados e não rotulados.

2025-11-17T08:08:30+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços nas Técnicas de Melhoria de Voz

Um novo método combina fala limpa e informação de ruído pra ter mais clareza.

2025-11-16T13:31:05+00:00 ― 6 min ler

Som Avanços em Reconhecimento Automático de Fala com Aprendizado Profundo por Transferência

Como o Aprendizado de Transferência Profundo transforma as tecnologias de Reconhecimento Automático de Fala.

2025-11-15T23:45:10+00:00 ― 7 min ler

Som Um Novo Método para Separação de Vozes na Música

Tecnologia inovadora separa vozes musicais usando técnicas avançadas de rastreamento.

2025-11-15T11:36:25+00:00 ― 7 min ler

Aprendizagem de máquinas Novo Método para Monitorar Vacas em Ambientes Barulhentos

Agricultores agora conseguem acompanhar o comportamento das vacas com precisão, mesmo com o barulho de fundo.

2025-11-15T09:59:15+00:00 ― 7 min ler

Som Avanços na Transcrição Automática de Música Usando Dados Sintetizados

Novos métodos de transcrição musical mostram potencial com dados de áudio sintetizado.

2025-11-15T04:19:10+00:00 ― 7 min ler

Som Analisando os Choros de Bebê: O Conjunto de Dados CryCeleb

Um grande conjunto de dados de choros de bebês ajuda a entender a comunicação e a saúde dos pequenos.

2025-11-15T02:42:00+00:00 ― 6 min ler

Som Melhorando a Identificação de Palavras-chave com o CosMix

Um novo método melhora os sistemas de reconhecimento de palavras-chave em condições com poucos recursos.

2025-11-14T21:50:30+00:00 ― 6 min ler

Som Previsões de Controle de Tráfego Aéreo Melhoradas com o Framework SIA-FTP

Um novo sistema melhora as previsões de trajetória de voo usando instruções faladas em tempo real.

2025-11-14T10:30:20+00:00 ― 4 min ler

Som Melhorando a Legendagem de Áudio com Novo Método de Perda

Uma nova abordagem melhora a legendagem de áudio gerando frases mais claras e variadas.

2025-11-14T09:41:45+00:00 ― 5 min ler

Som LORIS: Uma Nova Abordagem para Geração de Música em Vídeo

LORIS gera músicas de alta qualidade que se encaixam perfeitamente com os movimentos do vídeo.

2025-11-14T05:38:50+00:00 ― 7 min ler

Computação e linguagem Redes Neurais Aprendem Sintaxe a partir do Som

Estudo mostra que CNNs conseguem criar combinações de palavras a partir de dados de fala bruta.

2025-11-14T02:24:30+00:00 ― 8 min ler

Processamento de Áudio e Fala PLiX: Uma Nova Abordagem para Reconhecimento de Voz

A PLiX usa aprendizado de poucos exemplos pra melhorar o reconhecimento de voz em várias línguas.

2025-11-13T23:10:10+00:00 ― 9 min ler

Som Avanços na Detecção de Eventos Sonoros Usando Aprendizado com Poucos Exemplos

Esse artigo fala sobre como melhorar a detecção de sequências sonoras no reconhecimento de áudio.

2025-11-13T20:44:25+00:00 ― 6 min ler

Computação e linguagem Impacto da Qualidade do Áudio na Pesquisa de Aprendizado de Línguas

Estudo revela como a clareza do áudio afeta a análise da aquisição de linguagem em bebês.

2025-11-13T14:15:45+00:00 ― 6 min ler

Processamento de Áudio e Fala Nova Ferramenta de Simulação Acústica para Posicionamento Interno

Uma ferramenta melhora sistemas de posicionamento interno baseado em som através de simulação eficiente.

2025-11-13T10:12:50+00:00 ― 6 min ler

Computação e linguagem Avanços em Sistemas de Entendimento de Linguagem Falada

Uma nova abordagem melhora a compreensão da linguagem falada usando um processamento de áudio eficiente.

2025-11-13T02:07:00+00:00 ― 7 min ler

Som Melhorando a eficiência das CNNs através da poda de filtros

Este artigo apresenta um método pra melhorar CNNs removendo filtros desnecessários.

2025-11-12T15:35:25+00:00 ― 5 min ler

Processamento de Áudio e Fala Equilibrando Velocidade e Precisão no Reconhecimento de Fala

Uma nova abordagem melhora o reconhecimento de fala em tempo real ao equilibrar velocidade e precisão.

2025-11-12T13:09:40+00:00 ― 8 min ler

Computação e linguagem Apresentando o X-LLM: Um Novo Modelo de Linguagem Multimodal

O X-LLM integra imagens, vídeos e fala no processamento de linguagem.

2025-11-12T11:32:30+00:00 ― 6 min ler

Computação e linguagem Avanços no Reconhecimento de Emoções na Fala

Um novo método melhora a detecção de emoções na fala usando técnicas de autoatenção.

2025-11-12T06:41:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Fast Conformer: Avançando o Reconhecimento de Fala

O Fast Conformer melhora a velocidade e a precisão do reconhecimento de fala pra várias aplicações.

2025-11-11T20:09:25+00:00 ― 6 min ler

Computação e linguagem Ligando Processamento de Fala e Processamento de Linguagem Natural

Unindo a linguagem falada e escrita pra melhorar os modelos de comunicação.

2025-11-11T16:06:30+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Conversão de Fala em Canto

Pesquisas mostram um jeito de transformar palavras faladas em canto de forma eficiente.

2025-11-11T12:52:10+00:00 ― 8 min ler

Processamento de Áudio e Fala Tecnologia de Fala e Riscos de Privacidade

Analisando o impacto da tecnologia de fala na privacidade pessoal.

2025-11-11T11:15:00+00:00 ― 5 min ler

Processamento de Áudio e Fala QVoice: Seu Parceiro na Pronúncia em Árabe

Um app móvel criado pra melhorar a pronúncia em árabe pra todo mundo que tá aprendendo.

2025-11-11T08:49:15+00:00 ― 6 min ler

Som Corrigindo lacunas em áudio de fala com aprendizado de máquina

Esse artigo fala sobre como o aprendizado de máquina preenche lacunas no áudio da fala.

2025-11-11T07:12:05+00:00 ― 6 min ler

Processamento de Áudio e Fala Novo Método para Localização de Fonte Sonora Usando Três Microfones

Esse método ajuda pessoas com perda auditiva a identificar fontes sonoras no ambiente.

2025-11-11T05:34:55+00:00 ― 6 min ler

Som Avanços na Tecnologia de Melhoria de Voz

Explore as últimas técnicas que melhoram a clareza da fala em ambientes barulhentos.

2025-11-11T04:46:20+00:00 ― 6 min ler

Som Avanços na Separação de Fontes de Áudio com AudioSlots

AudioSlots melhora a clareza do som separando gravações de áudio misturadas de forma eficaz.

2025-11-11T03:57:45+00:00 ― 5 min ler

Som Criando Cantores Digitais: Uma Nova Abordagem

Um jeito de criar vozes que cantam sem precisar rotular a voz em detalhes.

2025-11-11T00:43:25+00:00 ― 7 min ler

Computação e linguagem Melhorando o reconhecimento de fala para palavras raras

Um método melhora como assistentes de voz reconhecem palavras pouco comuns usando contexto.

2025-11-10T23:54:50+00:00 ― 6 min ler

Som Revolucionando as Técnicas de Dublagem Automática

Um novo framework melhora a dublagem capturando os estilos de fala em diferentes idiomas.

2025-11-10T23:06:15+00:00 ― 8 min ler

Som Novo Método para Analisar Jitter de Áudio

Uma nova maneira de medir jitter usando análise de cruzamento zero em equipamentos de áudio.

2025-11-10T18:27:30+00:00 ― 8 min ler

Som Avanços nas Técnicas de Separação de Fonte Universal

Um novo framework usa dados fracamente rotulados pra fazer uma separação de áudio eficiente.

2025-11-10T11:46:05+00:00 ― 8 min ler