Um novo padrão avalia o desempenho dos sistemas de reconhecimento de voz em meio a várias interferências.

2025-08-19T14:16:50+00:00 ― 6 min ler

Som O Futuro da IA na Criação Musical

Explorando o papel da IA na formação da música através de técnicas e estruturas avançadas.

2025-08-18T14:47:55+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando Modelos de Fala com o RobustDistiller

Um novo método melhora a performance e a eficiência do modelo de fala em ambientes barulhentos.

2025-08-18T05:53:30+00:00 ― 6 min ler

Som Neural-SRP: Avançando na Localização de Fontes Sonoras

Um novo método combina técnicas tradicionais com redes neurais pra melhorar a localização do som.

2025-08-17T23:24:50+00:00 ― 6 min ler

Som Avançando a Detecção Acústica com Aprendizado de Máquina

Uma nova abordagem pra melhorar a detecção acústica sem comprometer a qualidade do áudio.

2025-08-17T20:59:05+00:00 ― 8 min ler

Som Avanços na Geração de Gestos a partir da Fala

Um novo sistema melhora a criação de gestos realistas usando só áudio de fala.

2025-08-17T14:30:25+00:00 ― 7 min ler

Som Notochord: Uma Nova Ferramenta MIDI para Músicos

Notochord melhora a criação de música MIDI em tempo real usando IA pra performances mais ricas.

2025-08-17T06:24:35+00:00 ― 7 min ler

Som Prompt-Singer: Uma Nova Abordagem para o Controle da Voz de Canto

Um método pra ter um controle mais intuitivo sobre vozes cantando usando comandos em linguagem natural.

2025-08-17T01:33:05+00:00 ― 8 min ler

Som Avanços no Reconhecimento de Emoções na Fala com o emoDARTS

O novo modelo emoDARTS melhora a precisão em reconhecer emoções na fala usando aprendizado profundo.

2025-08-16T17:27:15+00:00 ― 8 min ler

Som Avanços nas características de voz de Texto para Fala

Um estudo sobre como melhorar sistemas de TTS com amostras de voz diversas.

2025-08-16T12:35:45+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços na Tecnologia de Edição de Fala

Novas ferramentas melhoram a edição de gravações de voz e a qualidade de produção.

2025-08-15T09:03:55+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Tecnologia de Acompanhamento para Dança

Novos modelos melhoram as interações em dueto nas performances de dança virtuais.

2025-08-14T21:43:45+00:00 ― 8 min ler

Processamento de Áudio e Fala Reviver a História: A Arte da Restauração de Áudio

Descubra como a equalização generativa dá uma nova vida a gravações antigas de músicas.

2025-08-14T20:06:35+00:00 ― 8 min ler

Computação e linguagem Classificando Subdialetos do Curdo Sorani Através de Dados de Áudio

A pesquisa identifica e classifica os dialetos curdos sorani usando gravações de áudio extensivas.

2025-08-14T07:57:50+00:00 ― 7 min ler

Processamento de Áudio e Fala Automatizando a Ajuste de Som para Acústica Realista

Um novo método melhora o processamento de som através da afinação automática de Redes de Atraso com Feedback.

2025-08-14T07:09:15+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços na Avaliação Automática da Qualidade da Fala

Um novo método melhora a avaliação da fala usando gravações inteiras.

2025-08-14T06:20:40+00:00 ― 8 min ler

Som Medindo a Adesão em Modelos de Música Generativa

Uma nova forma de avaliar como a música segue os comandos de áudio.

2025-08-13T23:03:25+00:00 ― 10 min ler

Visão computacional e reconhecimento de padrões Apresentando o Conjunto de Dados 360+x para uma Compreensão de Cena Aprimorada

Um novo conjunto de dados melhora a forma como os robôs interpretam ambientes do mundo real.

2025-08-13T18:11:55+00:00 ― 8 min ler

Som Nova Abordagem para Separação de Áudio Usando Linguagem

Esse método melhora a separação de áudio juntando descrições de linguagem com a análise de som.

2025-08-13T14:57:35+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Apresentando o UniAV: Uma Abordagem Unificada para Localização de Vídeos

UniAV combina localização de ações, detecção de som e localização de eventos audiovisuais pra uma melhor compreensão de vídeos.

2025-08-13T10:06:05+00:00 ― 9 min ler

Processamento de Áudio e Fala CLaM-TTS: Avançando a Tecnologia de Texto para Fala

O CLaM-TTS melhora a síntese de fala usando técnicas avançadas pra mais eficiência e qualidade.

2025-08-13T08:28:55+00:00 ― 7 min ler

Redes Sociais e de Informação Analisando Música Através de Gráficos

Gráficos permitem novas ideias sobre a estrutura da música e suas relações.

2025-08-13T03:09:57+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Texto para Fala com RALL-E

RALL-E melhora a síntese de texto para fala pra deixar a fala mais clara e natural.

2025-08-13T01:11:40+00:00 ― 6 min ler

Som Avanços na Modelagem de Áudio Analógico Virtual

Explorando técnicas de aprendizado de máquina pra modelar efeitos de áudio analógico.

2025-08-12T22:37:18+00:00 ― 7 min ler

Som MuPT: Avançando a Geração de Música com Notação ABC

MuPT usa a notação ABC pra gerar música com IA de jeito eficaz.

2025-08-12T09:00:00+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando a Aprendizagem de Áudio com M2D e M2D-X

Novos métodos melhoram a representação de áudio através de técnicas de aprendizado auto-supervisionado.

2025-08-12T07:22:50+00:00 ― 7 min ler

Processamento de Áudio e Fala Melhorando a Reconstrução de Campo Sonoro com IA

Um método que usa IA melhora a representação sonora em vários ambientes.

2025-08-12T00:54:10+00:00 ― 8 min ler

Física Clássica Entendendo os Momentos Espectrais em Testes Eletromagnéticos

Explore o papel dos momentos espectrais em testes de câmara de reverberação e o impacto do ruído.

2025-08-12T00:28:33+00:00 ― 6 min ler

Processamento de Áudio e Fala Modelo Eficiente de Transcrição de Piano em Tempo Real

Um novo sistema para transcrição de piano em tempo real, leve e precisa.

2025-08-12T00:05:35+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Any2Point: Ligando a Compreensão 3D em Modelos de IA

Uma nova estrutura melhora a compreensão da IA em espaços 3D.

2025-08-11T19:14:05+00:00 ― 8 min ler

Som Avanços na Tecnologia de Edição de Atributos de Voz

Novo modelo permite controle preciso das qualidades da voz enquanto mantém o conteúdo.

2025-08-11T18:25:30+00:00 ― 5 min ler

Som Avançando a IA na Geração de Texto para Áudio

Um estudo sobre como melhorar as saídas de áudio a partir de comandos de texto usando otimização de preferências.

2025-08-11T07:05:20+00:00 ― 8 min ler

Som Avanços na Geração Automática de Música Usando IA

Explorando os desenvolvimentos recentes em ferramentas de IA para criação musical.

2025-08-10T16:30:50+00:00 ― 6 min ler

Som Melhorando a Marcação de Música com Embeddings de Palavras Musicais

Uma nova abordagem melhora a marcação e recuperação de músicas ao combinar termos de linguagem geral e termos musicais.

2025-08-10T06:47:50+00:00 ― 12 min ler

Processamento de Áudio e Fala FlashSpeech: Um Salto na Síntese de Fala

A FlashSpeech oferece soluções de síntese de fala rápidas e de alta qualidade.

2025-08-10T03:33:30+00:00 ― 8 min ler

Som Avanços na Detecção de Deepfake com o Framework RAD

Um novo método melhora a detecção de deepfakes de áudio usando referências de amostras similares.

2025-08-10T01:07:45+00:00 ― 7 min ler

Som Medindo a Virtuosidade na Performance de Guitarra Elétrica

Esse estudo analisa sinais sonoros pra medir a virtuosidade entre guitarristas elétricos.

2025-08-09T18:39:05+00:00 ― 5 min ler

Som Análise de Voz Inovadora para Detecção Precoce de Parkinson

Pesquisas mostram que analisar a fala pode ajudar a identificar a doença de Parkinson mais cedo.

2025-08-09T16:24:42+00:00 ― 6 min ler

Som Navegando pelas Vulnerabilidades no Reconhecimento de Emoções na Fala

Esse estudo analisa as fraquezas dos modelos SER em relação a ataques adversariais em diferentes línguas.

2025-08-08T21:35:55+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando a Extração de Falante Alvo Audiovisual com SEANet

O SEANet melhora a isolação do falante reduzindo o ruído no processamento de áudio.

2025-08-08T20:47:20+00:00 ― 8 min ler

Informática - Som