Este estudo analisa como o comprimento do sinal afeta o desempenho na separação de fala.

2025-11-21T04:27:00+00:00 ― 7 min ler

Robótica Usando o Barulho do Drone pra Medir Distância

Novo método estima distâncias usando o barulho do motor de drone.

2025-11-21T00:24:05+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avançando o Reconhecimento de Emoções com Dados Audiovisuais

Essa pesquisa destaca um novo modelo pra melhorar o reconhecimento de emoções usando dados de áudio e visual.

2025-11-20T21:09:45+00:00 ― 6 min ler

Computação e linguagem Máquinas e Sons: A IA Consegue Entender Descrições Auditivas?

Este estudo analisa como a IA avalia e descreve sons em comparação com os humanos.

2025-11-20T19:32:35+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Aprimoramento de Voz

FSB-LSTM melhora a clareza da fala em ambientes barulhentos com baixa latência e baixa complexidade.

2025-11-20T12:15:20+00:00 ― 6 min ler

Processamento de Áudio e Fala Otimizando a Detecção de Palavras-chave para Melhor Eficiência Energética

Pesquisas mostram como melhorar sistemas de reconhecimento de palavras-chave enquanto reduzem o consumo de energia.

2025-11-20T11:26:45+00:00 ― 6 min ler

Computação e linguagem Apresentando o Prak: Uma Ferramenta para Alinhamento Fonético

Prak simplifica o alinhamento fonético para pesquisas na língua tcheca.

2025-11-20T10:38:10+00:00 ― 5 min ler

Geofísica Avançando o Monitoramento Sísmico com a Técnica DAS-N2N

DAS-N2N usa aprendizado de máquina pra melhorar a coleta de dados sísmicos reduzindo o barulho.

2025-11-20T00:13:15+00:00 ― 8 min ler

Processamento de Áudio e Fala Avanços em Modelos de Reconhecimento de Fala Unificados

Novas técnicas melhoram a precisão no reconhecimento de fala em tempo real e fora dele.

2025-11-19T23:18:00+00:00 ― 6 min ler

Som Avanços na Geração Simbólica de Música Usando Tokenização de Subpalavras

Este estudo destaca como a tokenização de subpalavras melhora a qualidade e a eficiência da geração de música.

2025-11-19T20:03:40+00:00 ― 7 min ler

Criptografia e segurança Exemplos Adversariais em Reconhecimento de Fala: Riscos e Métodos

Analisando como ataques adversariais impactam sistemas de reconhecimento de fala e métodos pra melhorar a transferibilidade.

2025-11-19T17:37:55+00:00 ― 7 min ler

Som Avanços em Reconhecer Palavras Tendenciosas na Fala

CB-Conformer melhora o reconhecimento de fala para palavras tendenciosas com técnicas inovadoras.

2025-11-19T11:57:50+00:00 ― 6 min ler

Criptografia e segurança Assistentes de Voz: Equilibrando Conveniência e Riscos

Explore os desafios de segurança e privacidade da tecnologia de assistentes de voz.

2025-11-19T09:32:05+00:00 ― 7 min ler

Computação e linguagem Avançando o Reconhecimento de Fala para Dialetos Suíços Alemães

Melhorando modelos de reconhecimento de fala para o suíço-alemão usando técnicas avançadas e conjuntos de dados.

2025-11-19T04:40:35+00:00 ― 6 min ler

Som Insights sobre Alucinações Verbais Auditivas Através da Tecnologia Móvel

Estudo explora como dados móveis ajudam a entender alucinações auditivas verbais.

2025-11-19T03:52:00+00:00 ― 9 min ler

Processamento de Áudio e Fala Defendendo o Reconhecimento Automático de Fala contra Ataques Adversariais de Áudio

Um novo método melhora as defesas contra ataques adversariais de áudio em sistemas de reconhecimento de fala.

2025-11-18T22:11:55+00:00 ― 7 min ler

Som Avanços na Tecnologia de Detecção de Palavras-chave

A pesquisa foca em modelos eficientes para reconhecimento de palavras-chave usando redes ajustáveis.

2025-11-18T19:46:10+00:00 ― 5 min ler

Som CLaMP: Uma Nova Abordagem para Recuperação de Música

CLaMP combina música e linguagem pra classificação e busca automática de músicas.

2025-11-18T15:43:15+00:00 ― 7 min ler

Som Medindo a Beleza na Música: Uma Nova Abordagem

Um método matemático pra avaliar a beleza das performances musicais.

2025-11-18T07:37:25+00:00 ― 5 min ler

Som Avançando o Reconhecimento Automático de Fala com Técnicas Multimodais

Um novo modelo combina dados de áudio e texto pra melhorar a precisão do reconhecimento de fala.

2025-11-18T00:43:36+00:00 ― 6 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Transformação de Textura de Áudio

Um novo método melhora a transformação de textura de áudio para design sonoro criativo.

2025-11-17T21:05:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando a Criação de Áudio através de Descrições de Texto

Um novo método gera áudio a partir de texto usando modelos modernos.

2025-11-17T15:25:45+00:00 ― 6 min ler

Som DCASE 2023: Avançando a Síntese Automática de Sons Foley

Uma competição pra melhorar a criação automática de sons Foley pra multimídia.

2025-11-17T14:37:10+00:00 ― 6 min ler

Som Avançando a Classificação de Música com Playlists

Este estudo explora como usar playlists pra melhorar a classificação e similaridade de músicas.

2025-11-17T10:34:15+00:00 ― 5 min ler

Som Avanços em Reconhecimento Automático de Fala com Aprendizado Profundo por Transferência

Como o Aprendizado de Transferência Profundo transforma as tecnologias de Reconhecimento Automático de Fala.

2025-11-15T23:45:10+00:00 ― 7 min ler

Som Um Novo Método para Separação de Vozes na Música

Tecnologia inovadora separa vozes musicais usando técnicas avançadas de rastreamento.

2025-11-15T11:36:25+00:00 ― 7 min ler

Aprendizagem de máquinas Novo Método para Monitorar Vacas em Ambientes Barulhentos

Agricultores agora conseguem acompanhar o comportamento das vacas com precisão, mesmo com o barulho de fundo.

2025-11-15T09:59:15+00:00 ― 7 min ler

Som Avanços na Transcrição Automática de Música Usando Dados Sintetizados

Novos métodos de transcrição musical mostram potencial com dados de áudio sintetizado.

2025-11-15T04:19:10+00:00 ― 7 min ler

Som Analisando os Choros de Bebê: O Conjunto de Dados CryCeleb

Um grande conjunto de dados de choros de bebês ajuda a entender a comunicação e a saúde dos pequenos.

2025-11-15T02:42:00+00:00 ― 6 min ler

Som Melhorando a Identificação de Palavras-chave com o CosMix

Um novo método melhora os sistemas de reconhecimento de palavras-chave em condições com poucos recursos.

2025-11-14T21:50:30+00:00 ― 6 min ler

Som Previsões de Controle de Tráfego Aéreo Melhoradas com o Framework SIA-FTP

Um novo sistema melhora as previsões de trajetória de voo usando instruções faladas em tempo real.

2025-11-14T10:30:20+00:00 ― 4 min ler

Som Melhorando a Legendagem de Áudio com Novo Método de Perda

Uma nova abordagem melhora a legendagem de áudio gerando frases mais claras e variadas.

2025-11-14T09:41:45+00:00 ― 5 min ler

Som LORIS: Uma Nova Abordagem para Geração de Música em Vídeo

LORIS gera músicas de alta qualidade que se encaixam perfeitamente com os movimentos do vídeo.

2025-11-14T05:38:50+00:00 ― 7 min ler

Computação e linguagem Redes Neurais Aprendem Sintaxe a partir do Som

Estudo mostra que CNNs conseguem criar combinações de palavras a partir de dados de fala bruta.

2025-11-14T02:24:30+00:00 ― 8 min ler

Processamento de Áudio e Fala PLiX: Uma Nova Abordagem para Reconhecimento de Voz

A PLiX usa aprendizado de poucos exemplos pra melhorar o reconhecimento de voz em várias línguas.

2025-11-13T23:10:10+00:00 ― 9 min ler

Som Avanços na Detecção de Eventos Sonoros Usando Aprendizado com Poucos Exemplos

Esse artigo fala sobre como melhorar a detecção de sequências sonoras no reconhecimento de áudio.

2025-11-13T20:44:25+00:00 ― 6 min ler

Computação e linguagem Separando Informação do Falante e Dados Fonéticos em Modelos de Fala

Pesquisas mostram um jeito de melhorar o reconhecimento de fala separando a identidade do falante dos sons fonéticos.

2025-11-13T16:50:30+00:00 ― 6 min ler

Computação e linguagem Impacto da Qualidade do Áudio na Pesquisa de Aprendizado de Línguas

Estudo revela como a clareza do áudio afeta a análise da aquisição de linguagem em bebês.

2025-11-13T14:15:45+00:00 ― 6 min ler

Computação e linguagem Avanços em Sistemas de Entendimento de Linguagem Falada

Uma nova abordagem melhora a compreensão da linguagem falada usando um processamento de áudio eficiente.

2025-11-13T02:07:00+00:00 ― 7 min ler

Som Melhorando a eficiência das CNNs através da poda de filtros

Este artigo apresenta um método pra melhorar CNNs removendo filtros desnecessários.

2025-11-12T15:35:25+00:00 ― 5 min ler

Informática - Som