Artigos mais recentes para Áudio

Som Equilibrando Privacidade e Monitoramento de Áudio Inteligente

Novos métodos buscam proteger a privacidade da fala em sistemas de monitoramento de áudio.

2025-09-28T06:30:50+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Detectando Deepfakes: Uma Nova Abordagem

Um método que usa áudio e vídeo pra detectar deepfakes melhor.

2025-09-27T19:29:12+00:00 ― 5 min ler

Processamento de Áudio e Fala Avanços na Previsão de Qualidade de Áudio com GML

Um novo modelo de IA melhora a previsão das pontuações de qualidade de áudio.

2025-09-24T03:43:40+00:00 ― 6 min ler

Som Gerando Sons Realistas a partir de Vídeos Silenciosos

A pesquisa explora o deep learning pra criar áudio que combine com conteúdo de vídeo silencioso.

2025-09-22T04:45:50+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Combinando Som e Visuais pra Melhorar a Qualidade do Áudio

Um novo método melhora gravações de áudio usando pistas visuais.

2025-09-22T03:57:15+00:00 ― 7 min ler

Interação Homem-Computador O papel da IA na narrativa digital

Explorando o impacto do conteúdo gerado por IA na arte de contar histórias.

2025-09-22T02:56:54+00:00 ― 9 min ler

Som Melhorando a Qualidade da Música em Gravações do Dia a Dia

Um novo sistema melhora gravações de áudio pra uma experiência de escuta melhor.

2025-09-21T15:48:30+00:00 ― 7 min ler

Recuperação de informação Desafios em Aprender com Videoclipes

Esse estudo analisa as dificuldades de usar aprendizado contrastivo pra entender vídeo musical.

2025-09-18T17:21:45+00:00 ― 7 min ler

Som Novo Modelo Melhora Avaliação da Intensidade de Alimentação de Peixes

Uma abordagem unificada pra avaliar a alimentação dos peixes usando dados de áudio e vídeo.

2025-09-14T21:03:15+00:00 ― 6 min ler

Processamento de Áudio e Fala Melhorando a Diarização de Falantes com Modelos de Linguagem

Esse artigo explora avanços na diarização de falantes usando modelos de linguagem pra ter mais precisão.

2025-09-14T03:14:25+00:00 ― 5 min ler

Processamento de Áudio e Fala O Papel do Áudio na Detecção de Pedestres

Pesquisadores estão explorando a tecnologia de detecção de áudio para melhorar a identificação de pedestres em áreas urbanas.

2025-09-14T00:48:40+00:00 ― 6 min ler

Som Novos Métodos para Detectar Áudio Gerado por IA

Técnicas avançadas pra garantir a autenticidade do áudio na era da clonagem de voz.

2025-09-13T03:40:24+00:00 ― 6 min ler

Som Melhorando a Geração de Áudio Através de Técnicas de Alinhamento de Texto

Uma nova abordagem melhora a geração de áudio ao alinhar o áudio com as descrições em texto.

2025-09-11T07:13:25+00:00 ― 6 min ler

Processamento de Áudio e Fala Avançando Técnicas de Detecção de Fala Falsa

Novos métodos estão melhorando nossa habilidade de detectar discursos falsos de forma eficaz.

2025-09-11T02:21:55+00:00 ― 6 min ler

Som Melhorando o Treinamento de Vocoders com Aprendizado Contrastivo

Novos métodos melhoram o desempenho de vocoder com dados de áudio limitados.

2025-09-10T12:36:00+00:00 ― 6 min ler

Criptografia e segurança Melhorando a Detecção de Deepfake Através de Métodos de Treinamento Diversificados

Este estudo explora estratégias de treinamento pra melhorar a detecção de áudio falso.

2025-09-09T22:01:30+00:00 ― 6 min ler

Som Um Novo Método para Detectar Spoofing de Voz

Uma maneira firme de identificar anomalias de áudio e combater a falsificação de voz.

2025-09-09T07:27:00+00:00 ― 6 min ler

Computação e linguagem Avanços na Identificação de Linguagem Falada

Novos métodos combinam áudio e metadados pra melhorar o reconhecimento de idiomas.

2025-09-08T07:09:30+00:00 ― 7 min ler

Som Avanços na Síntese Musical Multi-Instrumental

Um novo método melhora a geração de música ao adicionar contexto de performance.

2025-09-07T01:11:55+00:00 ― 7 min ler

Som Avançando a Recuperação Musical com Aprendizado Auto-supervisionado

Uma nova abordagem usa aprendizado auto-supervisionado pra conectar áudio e partituras.

2025-09-06T21:09:00+00:00 ― 6 min ler

Som Ligando Áudio e Partituras com Redes Recorrentes

Um novo método melhora a combinação de áudio e partituras.

2025-09-06T19:31:50+00:00 ― 6 min ler

Som Nova Técnica de Marcação para Modelos de Áudio

Um método novo pra marcar áudio criado por modelos de difusão pra proteger a propriedade.

2025-09-06T04:08:45+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões AVI-Talking: Uma Nova Maneira de Criar Rostos Animados Expressivos

AVI-Talking cria rostos 3D super realistas que expressam emoções através do áudio.

2025-09-04T10:11:30+00:00 ― 7 min ler

Processamento de Sinal Uma Nova Abordagem para Identificar Sintomas de Esquizofrenia

Juntando áudio, vídeo e texto pra melhorar as avaliações de saúde mental.

2025-09-03T22:42:15+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Geração de Vídeos de Rosto Falante

Novos métodos melhoram o realismo em humanos digitais e avatares.

2025-09-03T03:38:42+00:00 ― 5 min ler

Som Combinando Voz e Rosto pra Uma Identificação Melhor

Novo método melhora a verificação de falantes ao combinar dados de áudio e visuais.

2025-09-02T07:50:15+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Detectando Humor em Vídeos com o FunnyNet-W

Um novo modelo identifica momentos engraçados em vídeos usando dados visuais, de áudio e de texto.

2025-08-30T23:09:25+00:00 ― 7 min ler

Processamento de Áudio e Fala Avanços em Processamento Multimodal com CoAVT

CoAVT integra dados de áudio, vídeo e texto pra uma compreensão melhor.

2025-08-28T12:02:50+00:00 ― 8 min ler

Som Audio Flamingo: Um Novo Modelo para Entender Som

O Audio Flamingo manda bem em ouvir, conversar e se adaptar a novas tarefas de áudio.

2025-08-26T16:19:20+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando a Comunicação Humana Através da Modelagem de Movimento

Um novo modelo gera movimentos realistas em conversas, melhorando a compreensão da interação.

2025-08-24T15:59:36+00:00 ― 6 min ler

Computação e linguagem Detecção em Tempo Real de Problemas em Conversas com IA

Um novo modelo melhora a detecção de quebra de diálogo para sistemas de IA.

2025-08-20T13:38:18+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões SonicDiffusion: Misturando som e criação de imagens

Um novo método pra criar e editar imagens usando sinais de áudio.

2025-08-14T22:56:36+00:00 ― 8 min ler

Processamento de Áudio e Fala CLaM-TTS: Avançando a Tecnologia de Texto para Fala

O CLaM-TTS melhora a síntese de fala usando técnicas avançadas pra mais eficiência e qualidade.

2025-08-13T08:28:55+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Geração de Gestos com o CoCoGesture

CoCoGesture cria gestos realistas que combinam com as palavras faladas, melhorando a interação.

2025-08-06T05:04:00+00:00 ― 6 min ler

Computação e linguagem Avanços na Tradução de Sinais MEG para Texto

Um novo framework converte sinais de MEG em texto significativo, ajudando na tecnologia de comunicação.

2025-08-03T03:43:42+00:00 ― 12 min ler

Som Transformando a Legendagem de Áudio Através de Métodos Inovadores

Uma nova abordagem para legendagem de áudio reduz a dependência de dados pareados.

2025-07-30T21:24:10+00:00 ― 6 min ler

Processamento de Áudio e Fala Usando Tecnologia de Áudio para Rastrear Pedestres

Este estudo analisa métodos de áudio para rastrear o movimento de pedestres em áreas urbanas.

2025-07-29T17:52:20+00:00 ― 8 min ler

Processamento de Áudio e Fala AV-CrossNet: Melhorando o Reconhecimento de Fala em Ruído

Um novo sistema ajuda a separar a fala do barulho pra uma comunicação mais clara.

2025-07-29T03:17:50+00:00 ― 7 min ler

Robótica Aprendendo com Som: Uma Nova Era para Robôs

Um novo sistema ajuda robôs a aprender tarefas usando áudio de demonstrações da vida real.

2025-07-26T09:42:35+00:00 ― 8 min ler

Aprendizagem de máquinas Combinando Texto e Áudio pra Melhor Classificação de Emoções

Um estudo sobre como usar dados de texto e áudio pra melhorar o reconhecimento de emoções.

2025-07-22T23:55:06+00:00 ― 7 min ler