Informática - Multimédia

RSS

Visão computacional e reconhecimento de padrões Novo Método para Detectar Memes Odiosos

Uma nova abordagem melhora a detecção de memes prejudiciais usando perguntas direcionadas.

2025-10-08T12:22:06+00:00 ― 9 min ler

Multimédia EMID: Uma Nova Abordagem para Música e Imagens

Explore os laços emocionais entre música e imagens com o dataset EMID.

2025-10-08T07:45:36+00:00 ― 6 min ler

Processamento de Imagem e Vídeo Reconstruindo Imagens Visuais a Partir de Sinais Cerebrais

Essa pesquisa conecta a atividade cerebral à percepção visual ao reconstruir imagens a partir dos sinais de EEG.

2025-10-08T06:54:00+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Conectando Palavras a Imagens: Fundamentos Visuais Desbloqueados

Descubra o impacto do ancoramento visual nas interações entre linguagem e imagem.

2025-10-07T08:43:06+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avançando o Reconhecimento de Vídeo com AVGN

Um novo método aumenta a eficiência no reconhecimento de vídeo usando dados de áudio e visuais.

2025-10-07T00:09:36+00:00 ― 6 min ler

Inteligência Artificial Avanços em IA para Teste de Jogos

Um novo agente de IA melhora a eficiência e a qualidade dos testes de jogos.

2025-10-06T23:38:00+00:00 ― 7 min ler

Multimédia Apresentando o Dronevision: Um Sistema de Display 3D Compacto

A Dronevision tá revolucionando o multimedia 3D com um display do tamanho de uma mesa usando drones voadores.

2025-10-06T22:03:12+00:00 ― 8 min ler

Multimédia Avaliação de Sensores de Distância para Pontinhos de Luz Voadores

Um estudo sobre sensores essenciais para o desempenho de novos drones.

2025-10-06T21:55:18+00:00 ― 5 min ler

Recuperação de informação Avançando Sistemas de Recomendação com Dados Multi-Modais

Um novo framework melhora as sugestões de itens usando diferentes tipos de dados.

2025-10-05T12:52:24+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões EVE: Uma Nova Abordagem para Modelos de Linguagem e Visão

Descubra a EVE, um modelo que melhora a compreensão de imagens e texto.

2025-10-05T11:09:42+00:00 ― 7 min ler

Multimédia Avanços nos Modelos de Pré-treinamento de Visão-Linguagem

A pesquisa foca em melhorar modelos que ligam visuais e texto através da compreensão de linguagem.

2025-10-04T21:51:48+00:00 ― 7 min ler

Interação Homem-Computador Avanços na Geração de Gestos para Comunicação com IA

Novo modelo melhora a geração de gestos para interações mais parecidas com humanas.

2025-10-04T05:32:12+00:00 ― 6 min ler

Multimédia Avanços em Combinação Visual Acústica

Um novo método melhora a correspondência de áudio usando imagens, aumentando o realismo em ambientes de áudio.

2025-10-03T03:55:25+00:00 ― 8 min ler

Aprendizagem de máquinas Os Riscos da Esteganografia em Aprendizado de Máquina

Analisando preocupações com dados ocultos em modelos de machine learning e suas implicações de segurança.

2025-10-03T03:12:12+00:00 ― 8 min ler

Processamento de Áudio e Fala Novo Conjunto de Dados Liga Emoções à Música MIDI

Um conjunto de dados liga emoções a músicas MIDI analisando as letras das canções.

2025-10-03T02:18:15+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando o TextVQA com o Método Separar e Localizar

Uma nova abordagem melhora a precisão ao responder perguntas sobre textos em imagens.

2025-10-02T16:40:12+00:00 ― 6 min ler

Multimédia Avanços em Perguntas e Respostas Visuais com PROOFREAD

O PROOFREAD melhora a resposta a perguntas visuais usando conhecimento de grandes modelos de linguagem.

2025-10-02T08:30:24+00:00 ― 7 min ler

Som Avançando a Legendagem Musical com Modelos de Linguagem Grandes

Usando LLMs pra criar um dataset gigante pra legendagem de música.

2025-10-02T08:29:25+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Geração de Terreno com TDN

A Rede de Difusão de Terreno melhora a criação de paisagens realistas com a participação dos usuários.

2025-10-02T06:00:18+00:00 ― 6 min ler

Som Avanços na Tecnologia de Transferência de Estilo de Voz

HierVST transforma vozes de forma suave, melhorando a qualidade do áudio sem precisar de muitos dados.

2025-10-02T05:15:05+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Novo Método para Transformar Rostos em Desenhos Artísticos

Uma nova abordagem transforma fotos de rostos em desenhos parecidos com humanos usando técnicas avançadas.

2025-10-02T04:33:24+00:00 ― 7 min ler

Multimédia Avanços na Estimativa de Engajamento para Conversas

A pesquisa desenvolve um modelo pra medir com precisão o engajamento em conversas.

2025-10-01T21:57:50+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Protegendo a Autenticidade: O Método DRAW para Imagens RAW

Uma nova maneira de proteger imagens RAW de manipulação.

2025-10-01T10:37:40+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Entendendo VideoQA: Desafios e Soluções

Novo conjunto de dados e métodos melhoram a precisão na resposta de perguntas sobre vídeos.

2025-10-01T06:57:48+00:00 ― 7 min ler

Computação e linguagem Avançando a Análise de Sentimentos com o Framework UniSA

A estrutura da UniSA unifica tarefas na análise de sentimentos pra uma melhor reconhecimento das emoções.

2025-10-01T06:18:18+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Nova técnica engana detectores de deepfake

Um método que usa movimentos de cabeça engana com sucesso sistemas de detecção de deepfake.

2025-10-01T02:45:00+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Apresentando o MultiWay-Adapter para Modelos Multimodais

Uma estrutura pra adaptação eficiente de modelos de linguagem grandes multimodais.

2025-10-01T01:18:06+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Uma Abordagem Comparativa para Inspeção de Conjuntos de Dados

Usando protótipos pra melhorar a comparação de datasets em visão computacional.

2025-09-30T09:38:00+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Design de Tipografia Automatizada para Comunicação Eficaz

Um programa que gera tipografia visualmente atraente, adaptada ao contexto.

2025-09-30T06:28:24+00:00 ― 5 min ler

Som MusicLDM: Uma Nova Abordagem para Geração de Música a partir de Texto

MusicLDM transforma texto em música original, oferecendo novas maneiras de ser criativo.

2025-09-30T05:28:40+00:00 ― 8 min ler

Som Melhorando Técnicas de Extração de Melodia Vocal com Deep Learning

Novos métodos melhoram a precisão de extrair melodias cantadas de áudios mistos.

2025-09-30T01:25:45+00:00 ― 8 min ler

Computação e linguagem Avanços na Tecnologia de Legendas de Áudio

Novos métodos buscam melhorar a legendagem de áudio pra ter mais precisão e eficiência.

2025-09-30T00:25:00+00:00 ― 6 min ler

Multimédia Melhorando Métodos de Avaliação de Legendas de Áudio

Novas técnicas melhoram a avaliação da qualidade da legendagem de áudio através da detecção automática de erros.

2025-09-30T00:17:06+00:00 ― 6 min ler

Processamento de Áudio e Fala Analisando a Qualidade da Voz e Seu Impacto

Este estudo explora métodos de classificação de qualidade de voz e sua importância na comunicação.

2025-09-29T12:28:25+00:00 ― 5 min ler

Criptografia e segurança A Necessidade Crescente de Steganálise na Segurança da Informação

A esteganálise ajuda a detectar mensagens escondidas em multimídia, garantindo uma comunicação segura.

2025-09-28T23:31:05+00:00 ― 5 min ler

Multimédia TranSTYLer: Um Salto na Comunicação Virtual

Transformando gestos para agentes virtuais sem perder o significado.

2025-09-28T18:39:35+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Detectando Deepfakes: Uma Nova Abordagem

Um método que usa áudio e vídeo pra detectar deepfakes melhor.

2025-09-27T19:29:12+00:00 ― 5 min ler

Som Avançando a Geração de Gestos para Humanos Digitais

Um novo método cria gestos realistas a partir de áudio de fala bruto.

2025-09-27T08:39:05+00:00 ― 5 min ler

Interação Homem-Computador UnifiedGesture: Avançando na Geração Automática de Gestos

Um novo método para gerar gestos que combinam com a fala de forma eficaz.

2025-09-27T06:35:00+00:00 ― 8 min ler

Computação e linguagem Enfrentando a Subjetividade em Artigos de Notícias

Detectar a subjetividade nas notícias é crucial pra ter informações precisas.

2025-09-27T03:57:00+00:00 ― 7 min ler