Pesquisas sobre novos modelos melhoram a qualidade do áudio em filmes e na TV.

2025-07-03T17:34:35+00:00 ― 6 min ler

Gráficos Avançando a Geração de Gestos para Humanos Virtuais

DiM-Gesture cria gestos realistas sincronizados com a fala para interações digitais.

2025-07-03T15:23:54+00:00 ― 5 min ler

Aplicações Acompanhando as Vocalizações de Bebês: Ideias sobre o Desenvolvimento da Linguagem

Analisar os sons de uma criança mostra etapas importantes do crescimento da linguagem.

2025-07-03T15:13:32+00:00 ― 6 min ler

Som Melhorando RNNs para Modelagem de Efeitos de Áudio

Novos métodos para um controle melhor de RNNs melhoram as simulações de efeitos de áudio.

2025-07-03T15:08:50+00:00 ― 10 min ler

Som Apresentando MulliVC: Sistema de Conversão de Voz de Nova Geração

MulliVC transforma vozes em várias línguas com uma precisão e clareza impressionantes.

2025-07-03T11:54:30+00:00 ― 6 min ler

Som NeuralMultiling: Uma Nova Abordagem para Verificação de Fala

Um sistema que permite autenticação por voz em várias línguas para dispositivos móveis.

2025-07-03T08:40:10+00:00 ― 6 min ler

Som Revolucionando a Criação Musical com o TEAdapter

TEAdapter melhora a geração de música a partir de texto, dando aos usuários mais controle e criatividade.

2025-07-02T17:17:05+00:00 ― 5 min ler

Som Melhorando a Detecção de Sons Anômalos com Aprendizado Ativo

Um novo framework melhora a detecção de sons de máquinas usando técnicas de aprendizado ativo.

2025-07-02T13:14:10+00:00 ― 5 min ler

Computação e linguagem O Impacto dos Métodos de Anotação na Resumação de Fala

Esse estudo analisa como diferentes métodos de resumo afetam a qualidade e o conteúdo.

2025-07-02T05:56:55+00:00 ― 6 min ler

Som Avanços na Separação de Fonte de Áudio com RQ-VAE

Novo modelo de aprendizado de máquina melhora as técnicas de separação de fontes de áudio.

2025-07-02T05:08:20+00:00 ― 6 min ler

Som Music2Latent: Uma Nova Ferramenta para Compressão de Áudio

Music2Latent simplifica a compressão de áudio, mantendo a qualidade alta para várias aplicações.

2025-07-02T04:19:45+00:00 ― 6 min ler

Computação e linguagem Novo Modelo TOGGL Melhora a Transcrição de Fala

O modelo TOGGL melhora a precisão da transcrição em situações de fala sobreposta.

2025-07-02T03:31:10+00:00 ― 6 min ler

Som Nova Método Melhora a Clareza da Fala em Óculos Inteligentes

Um sistema pra melhorar a clareza da fala em ambientes barulhentos usando óculos inteligentes.

2025-07-02T02:42:35+00:00 ― 6 min ler

Computação e linguagem Detectando Discurso de Ódio em Áudio: Novas Abordagens

Um estudo sobre como identificar momentos de discurso de ódio em áudios usando técnicas novas.

2025-07-02T00:16:50+00:00 ― 6 min ler

Computação e linguagem Melhorando o Reconhecimento de Fala com Aprendizado de Representação de Ruído de Contexto

Um método pra melhorar a qualidade do reconhecimento de fala em ambientes barulhentos.

2025-07-01T23:28:15+00:00 ― 7 min ler

Som Controlando a Surpresa Musical na Composição

Um jeito de criar música envolvente controlando os níveis de surpresa.

2025-07-01T22:39:40+00:00 ― 6 min ler

Computação Neural e Evolutiva Novo Framework para Processar Sinais Neurais

Uma nova abordagem codifica e reconstrói sinais sensoriais usando trens de disparo.

2025-07-01T21:02:30+00:00 ― 8 min ler

Som Prevendo Emoções na Música para Marketing

Esse artigo fala sobre como usar aprendizado profundo pra prever reações emocionais à música.

2025-07-01T10:30:55+00:00 ― 7 min ler

Som Mapeando os Sons do Nosso Mundo

Um novo método pra visualizar distribuições sonoras globais usando dados de áudio e satélite.

2025-07-01T08:53:45+00:00 ― 7 min ler

Som Avanços na Tecnologia de Codificação de Fala e Áudio

Explorando novos métodos de compressão de áudio pra melhorar a qualidade do som.

2025-07-01T07:16:35+00:00 ― 8 min ler

Som Avançando Métodos de Detecção de Áudio Deepfake

A pesquisa foca em detectar áudio deepfake através de técnicas aprimoradas e expansão de dados.

2025-07-01T06:28:00+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Melhorando a Detecção de Deepfakes com Detalhes Finos

Uma nova abordagem foca em inconsistências sutis na detecção de deepfakes.

2025-07-01T04:02:15+00:00 ― 7 min ler

Computação e linguagem Taxa de Fala: O Papel do Comprimento das Frases e Fatores Sociais

Analisando como o comprimento das falas e fatores sociais influenciam a velocidade da fala.

2025-07-01T03:13:40+00:00 ― 6 min ler

Som PeriodWave: Uma Nova Abordagem para Geração de Forma de Onda

Apresentando o PeriodWave, um modelo que melhora a velocidade e a qualidade da geração de áudio.

2025-06-30T15:53:30+00:00 ― 7 min ler

Som Um Guia para Submeter Artigos Científicos

Aprenda como preparar e enviar seu artigo científico de maneira eficaz.

2025-06-30T12:39:10+00:00 ― 8 min ler

Som A Evolução Sonora da Música Popular

Uma olhada em como as características sonoras na música pop mudaram ao longo das décadas.

2025-06-30T01:19:00+00:00 ― 5 min ler

Som Avançando a Criação de Tablaturas de Guitarra com Aprendizado Profundo

Um novo sistema melhora a criação de tablaturas de guitarra usando métodos de deep learning.

2025-06-29T22:55:06+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando o Reconhecimento de Fala com Palavras-Chave Contextuais

Um novo sistema melhora o reconhecimento de fala usando palavras-chave contextuais pra ter mais precisão.

2025-06-29T22:53:15+00:00 ― 6 min ler

Som PeriodWave-Turbo: Uma Nova Era na Geração de Som

O PeriodWave-Turbo melhora a velocidade e a qualidade da geração de som em várias aplicações.

2025-06-29T22:04:40+00:00 ― 6 min ler

Computação e linguagem Avanços em Modelos de Fala Através de Técnicas de Poda

Pesquisas mostram como fazer modelos de fala menores e mais eficientes.

2025-06-29T16:24:35+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Clareza no Áudio: Técnicas de Separação de Diálogo

A separação de diálogos ajuda a galera a ouvir as conversas claramente no meio do barulho de fundo.

2025-06-29T11:33:05+00:00 ― 7 min ler

Som Avanços na Detecção de Eventos Sonoros com MAT-SED

MAT-SED usa um modelo Transformer novo pra detecção eficaz de eventos sonoros.

2025-06-29T09:55:55+00:00 ― 6 min ler

Som Uma Nova Abordagem para Diagnóstico de Sons do Coração

Combinando sons do coração e ecocardiografia pra melhorar o diagnóstico de doenças cardíacas congênitas.

2025-06-29T09:07:20+00:00 ― 7 min ler

Som GAPS: Um Novo Recurso para Pesquisa em Violão Clássico

Um conjunto de dados rico de gravações de guitarra ligadas a partituras pra pesquisa e análise.

2025-06-29T07:30:10+00:00 ― 5 min ler

Interação Homem-Computador Melhorando a Localização de Som em XR com Auptimize

Auptimize melhora a colocação de sons pra uma interação melhor do usuário em XR.

2025-06-29T04:15:50+00:00 ― 7 min ler

Processamento de Áudio e Fala Malacopula: Uma Nova Ameaça aos Sistemas de Verificação de Voz

Malacopula questiona a confiabilidade das tecnologias de verificação automática de falantes.

2025-06-29T03:27:15+00:00 ― 7 min ler

Gráficos MetaFace: Avançando Animações de Rosto 3D Falante

Um novo método pra criar animações 3D de rostos mais realistas, se ajustando aos estilos de fala de cada um.

2025-06-28T19:21:25+00:00 ― 6 min ler

Som Melhorando a Detecção de Palavras-Chave com Treinamento Adversarial

O treinamento adversarial melhora a precisão na detecção de palavras-chave em fala sintética e real.

2025-06-28T13:41:20+00:00 ― 6 min ler

Som Avanços em Few-Shot Learning para Processamento de Áudio

Esse texto fala sobre aprendizado com poucos exemplos e seu impacto em tarefas de áudio.

2025-06-28T12:04:10+00:00 ― 8 min ler

Som Transformando a Comunicação: Conversão de Voz Baseada em Rosto

Nova tecnologia conecta características faciais à voz, ajudando na comunicação para quem não tem voz.

2025-06-28T06:24:05+00:00 ― 6 min ler

Informática - Som