Esse estudo revela padrões nos sons das baleias cachalote e seus possíveis significados.

2025-12-01T05:12:16+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços em Localizar Sons em Vídeos

Pesquisas melhoram a habilidade das máquinas de localizar objetos que fazem barulho em vídeos.

2025-12-01T02:30:30+00:00 ― 9 min ler

Processamento de Áudio e Fala Avanços nas Técnicas de Reprodução do Campo Sonoro

Este artigo examina dois métodos para melhorar a qualidade da reprodução sonora.

2025-11-30T19:13:15+00:00 ― 7 min ler

Som A Arte da Segmentação Musical: Um Olhar Mais Atento

Descubra como as estruturas musicais melhoram nossa experiência de ouvir.

2025-11-30T16:47:30+00:00 ― 6 min ler

Som Avanços na Análise da Estrutura Musical

Explorando novas maneiras de segmentar a estrutura da música e suas implicações.

2025-11-30T11:07:25+00:00 ― 6 min ler

Computação e linguagem Método Inovador para Tradução de Músicas

Uma nova forma de traduzir músicas que combina as letras com as melodias de um jeito eficiente.

2025-11-29T10:49:55+00:00 ― 8 min ler

Som Aprimorando Jogos de Luta com Música de Fundo Adaptativa

Essa pesquisa explora o uso de música adaptativa no DareFightingICE pra entender melhor os jogadores.

2025-11-29T01:06:55+00:00 ― 7 min ler

Som Novo Conjunto de Dados Tem o Objetivo de Melhorar a Tecnologia de Leitura Labial

Pesquisadores desenvolvem o conjunto de dados LIPSFUS para melhorar sistemas de leitura labial.

2025-11-28T23:29:45+00:00 ― 6 min ler

Aprendizagem de máquinas Avanços na Verificação de Fala com Dados Não Rotulados

Esse framework melhora a verificação de falantes usando dados não rotulados e técnicas de agrupamento.

2025-11-28T19:26:50+00:00 ― 6 min ler

Interação Homem-Computador Avanços em Sistemas de Reconhecimento de Emoções Usando Wearables

Um novo framework melhora a detecção de emoções usando aprendizado auto-supervisionado.

2025-11-28T14:35:20+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Novo Método para Gerar Sons Realistas a Partir de Vídeo

Essa abordagem liga ações de vídeo e som usando física pra ter efeitos sonoros melhores.

2025-11-28T12:58:10+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando o Reconhecimento de Fala Audiovisual com Dicas Visuais

Um novo método melhora o reconhecimento de fala usando dados visuais com modelos já existentes.

2025-11-28T10:32:25+00:00 ― 8 min ler

Inteligência Artificial Uma Nova Estrutura para Anotações Musicais

Este artigo fala sobre uma abordagem sistemática para a anotação de música.

2025-11-28T06:29:30+00:00 ― 7 min ler

Inteligência Artificial Entendendo a Ontologia das Notas Musicais

Uma abordagem estruturada pra representação musical e análise de performance.

2025-11-28T05:40:55+00:00 ― 6 min ler

Computação e linguagem Avançando Modelos de Fala Visualmente Fundamentados Bilingues

Esse estudo melhora modelos de fala bilíngues usando um suporte linguístico forte.

2025-11-28T04:03:45+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Criando Imagens a Partir de Sons: O Modelo Sound2Scene

Novo modelo transforma sons em imagens claras, unindo informações auditivas e visuais.

2025-11-28T03:15:10+00:00 ― 7 min ler

Processamento de Áudio e Fala Novo Método de Legenda para Áudio com Dados Limitados

Uma nova abordagem pra gerar legendas de áudio usando modelos de linguagem pré-treinados.

2025-11-28T02:26:35+00:00 ― 7 min ler

Computação e linguagem Inovações Modulares em Sistemas de Reconhecimento de Fala

Uma nova abordagem melhora a adaptabilidade da tecnologia de reconhecimento de voz.

2025-11-27T16:43:35+00:00 ― 5 min ler

Computação e linguagem Novas Abordagens na Tecnologia de Reconhecimento de Fala

Uma olhada nas novidades em modelos de reconhecimento de fala para mais eficiência e precisão.

2025-11-27T15:55:00+00:00 ― 6 min ler

Computação e linguagem Nova Método para Avaliar Sistemas de Reconhecimento de Fala

Uma maneira nova de medir o desempenho do reconhecimento de fala sem precisar de transcrição manual.

2025-11-26T22:06:10+00:00 ― 6 min ler

Computação e linguagem Anonymização de Voz em Diagnósticos de COVID-19: Equilibrando Privacidade e Precisão

Analisando como a anonimização da voz afeta sistemas de diagnóstico da COVID-19 e a privacidade do usuário.

2025-11-26T01:03:00+00:00 ― 9 min ler

Interação Homem-Computador Revolucionando a bateria: O Sistema de Air Drumming

Experimente tocar bateria só com dois paus e um smartphone, sem precisar de equipamento pesado.

2025-11-25T21:48:40+00:00 ― 6 min ler

Interação Homem-Computador Como a IA está moldando a mixagem de música

Ferramentas de IA facilitam a mixagem, oferecendo novas opções tanto para amadores quanto para profissionais.

2025-11-24T20:42:35+00:00 ― 8 min ler

Som Bolhas na Água: Uma Nova Fronteira Sonora

Bolas podem ser a chave pra gerar música inovadora.

2025-11-24T18:42:00+00:00 ― 7 min ler

Som Avanços na Legenda Automática de Áudio

Um olhar sobre novos métodos que melhoram a legendagem de áudio para uma acessibilidade melhor.

2025-11-24T10:11:00+00:00 ― 5 min ler

Computadores e sociedade Biometria de Voz: Conjuntos de Dados, Preconceitos e Desafios de Privacidade

Analisando o uso de conjuntos de dados em biometria vocal, aparecem preocupações sérias sobre viés e privacidade.

2025-11-24T06:56:40+00:00 ― 8 min ler

Processamento de Áudio e Fala Melhorando a Verificação de Locutor com Margin-Mixup

Um novo método melhora os sistemas de verificação de voz para vozes sobrepostas.

2025-11-24T01:16:35+00:00 ― 6 min ler

Aprendizagem de máquinas Novas Técnicas para Processamento de Fala

Métodos inovadores para representação eficaz de segmentos de fala em tarefas de processamento.

2025-11-23T14:45:00+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando a Síntese de Fala com Previsão de Pausas

Melhorando sistemas de TTS pra contar histórias de maneira mais legal com pausas bem colocadas.

2025-11-23T09:53:30+00:00 ― 5 min ler

Som AffectMachine-Clássico: Uma Nova Maneira de Criar Música Emocional

AffectMachine-Clássico gera música clássica em tempo real pra ajudar a lidar com as emoções.

2025-11-23T06:39:10+00:00 ― 8 min ler

Som Impacto dos sistemas de TTS na tradução de fala para fala

Este estudo analisa como diferentes sistemas de TTS melhoram o desempenho do modelo S2ST.

2025-11-23T02:36:15+00:00 ― 7 min ler

Computação e linguagem Modelando Backchannels: Um Passo Rumo a Conversas Naturais

Pesquisas mostram como os backchannels melhoram a comunicação das máquinas.

2025-11-23T01:47:40+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços na Manipulação de Áudio Usando Redes Neurais

Pesquisas mostram novas maneiras de manipular som usando redes neurais na produção musical.

2025-11-23T00:10:30+00:00 ― 6 min ler

Som Melhorando o Aprendizado Audiovisual com Filmes Dublados

Pesquisas usam filmes dublados pra melhorar a conexão entre visão e som em machine learning.

2025-11-22T07:58:50+00:00 ― 6 min ler

Processamento de Áudio e Fala Uma Nova Maneira de Analisar os Sons da Fala ao Longo do Tempo

Apresentando absement, um jeito de medir sons de fala dinamicamente ao longo do tempo.

2025-11-22T03:07:20+00:00 ― 6 min ler

Som Avanços nos Métodos de Transcrição de Canto

Uma nova forma de transcrever com precisão as notas e letras das músicas usando tecnologia.

2025-11-22T01:30:10+00:00 ― 6 min ler

Processamento de Áudio e Fala Novo Modelo Melhora o Reconhecimento de Emoções em Conversas

Modelo Hierárquico de Atenção Cruzada melhora a compreensão emocional em diversas formas de comunicação.

2025-11-21T19:01:30+00:00 ― 6 min ler

Som Avanços em Sistemas de Recuperação de Música

Novos métodos melhoram a marcação e recuperação de músicas usando menos intervenção humana.

2025-11-21T06:52:45+00:00 ― 6 min ler

Som Analisando Comprimentos de Sinal em Modelos de Separação de Fala

Este estudo analisa como o comprimento do sinal afeta o desempenho na separação de fala.

2025-11-21T04:27:00+00:00 ― 7 min ler

Robótica Usando o Barulho do Drone pra Medir Distância

Novo método estima distâncias usando o barulho do motor de drone.

2025-11-21T00:24:05+00:00 ― 5 min ler

Informática - Som