Informática - Multimédia

RSS

Interação Homem-Computador UnifiedGesture: Avançando na Geração Automática de Gestos

Um novo método para gerar gestos que combinam com a fala de forma eficaz.

2025-09-27T06:35:00+00:00 ― 8 min ler

Computação e linguagem Enfrentando a Subjetividade em Artigos de Notícias

Detectar a subjetividade nas notícias é crucial pra ter informações precisas.

2025-09-27T03:57:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões VEATIC: Um Novo Conjunto de Dados para Reconhecimento de Emoções

VEATIC oferece um conjunto de dados mais rico para estudar as emoções humanas no contexto.

2025-09-27T02:30:06+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avaliando a Qualidade em Modelos de Texto para Vídeo

Avaliando o realismo e a qualidade dos vídeos gerados a partir de texto.

2025-09-26T21:14:06+00:00 ― 8 min ler

Processamento de Imagem e Vídeo Avanços nas Técnicas de Compressão de Imagem

Um novo método melhora a compressão de imagens para diferentes tipos de imagem.

2025-09-25T16:58:30+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Abordando o viés de comprimento de quadro na recuperação de vídeo

Este artigo fala sobre o viés do tamanho do quadro na busca de texto-vídeo e uma nova abordagem para resolver isso.

2025-09-25T15:12:54+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Reconhecendo a Linguagem Corporal em Interações em Grupo

Um novo método melhora a forma como a tecnologia detecta o comportamento humano em grupos.

2025-09-24T16:34:06+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Melhorando a Confiabilidade do CLIP com o LP-CLIP

Aprenda como o LP-CLIP melhora a robustez de modelos multimodais como o CLIP.

2025-09-24T12:21:18+00:00 ― 6 min ler

Computação e linguagem Novo Conjunto de Dados Revoluciona a Tradução de Letra de K-pop

Um conjunto de dados inovador ajuda no estudo da tradução de letras de K-pop.

2025-09-24T08:24:18+00:00 ― 9 min ler

Aprendizagem de máquinas Momentos Audiovisuais no Tempo: Um Novo Conjunto de Dados para Reconhecimento de Ações

A AVMIT dá pros pesquisadores umas ideias de como o som e a visão se relacionam no reconhecimento de ações.

2025-09-24T07:46:35+00:00 ― 7 min ler

Som Avanços na Tecnologia de Anti-Spoofing de Áudio

Um novo método melhora a detecção de áudio falso em sistemas de reconhecimento de voz.

2025-09-23T23:40:45+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Aumentando a Memória de Vídeos Através de Recortes Baseados em Saliência

Este estudo analisa como o corte de vídeo pode melhorar a lembrança, focando na saliência visual.

2025-09-23T18:03:12+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões E avaliando modelos em tarefas de visão de baixo nível

Avaliando grandes modelos em tarefas visuais de baixo nível através do Q-Bench.

2025-09-22T06:53:54+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Combinando Som e Visuais pra Melhorar a Qualidade do Áudio

Um novo método melhora gravações de áudio usando pistas visuais.

2025-09-22T03:57:15+00:00 ― 7 min ler

Interação Homem-Computador O papel da IA na narrativa digital

Explorando o impacto do conteúdo gerado por IA na arte de contar histórias.

2025-09-22T02:56:54+00:00 ― 9 min ler

Multimédia Ligando Emoções nas Imagens à Busca de Música

Um novo sistema conecta imagens emocionais à música pra melhorar a descoberta.

2025-09-21T16:37:05+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Previsão de Visualização para Vídeo em Streaming

MFTR aumenta a precisão da previsão de viewport para experiências de vídeo imersivas.

2025-09-21T12:12:06+00:00 ― 7 min ler

Interação Homem-Computador Melhorando o Controle de Drones com Tecnologia de Gêmeo Digital

Um sistema pra tornar o controle remoto de UAVs mais seguro e confiável usando Gêmeo Digital.

2025-09-20T11:28:05+00:00 ― 7 min ler

Engenharia de software Abordando o Viés em Modelos de Geração de Imagens

Uma nova estrutura identifica e mede o viés em sistemas de geração de imagens.

2025-09-19T11:13:18+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Avanços na Qualidade de Imagem com Modelos de Difusão

Explore como os Modelos de Difusão melhoram a super-resolução em várias áreas.

2025-09-19T10:33:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões NU-Class Net: Melhorando a Qualidade de Vídeo Após Compressão

Um novo modelo melhora vídeos de baixa qualidade enquanto diminui a carga de processamento.

2025-09-19T05:25:42+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Um Novo Método para Avaliar a Qualidade de Imagens e Vídeos

SAMA melhora a avaliação de qualidade de imagem e vídeo com técnicas de amostragem eficazes.

2025-09-19T00:33:24+00:00 ― 6 min ler

Recuperação de informação Desafios em Aprender com Videoclipes

Esse estudo analisa as dificuldades de usar aprendizado contrastivo pra entender vídeo musical.

2025-09-18T17:21:45+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Revolucionando os Olhos dos Personagens na Animação

Um novo método simplifica o design dos olhos de personagens animados.

2025-09-18T14:01:24+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avançando na Compressão de Imagem com Análise de Frequência

Um novo método melhora a compressão de imagem focando nas bandas de frequência.

2025-09-16T14:45:18+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Vlogger: Uma Nova Ferramenta para Criar Vídeos

Vlogger simplifica o vídeo blog, deixando mais rápido e fácil pra galera que cria conteúdo.

2025-09-16T11:12:00+00:00 ― 7 min ler

Multimédia Os Custos Ambientais do Streaming de Vídeo

Analisando o uso de energia e o impacto do streaming de vídeo no meio ambiente.

2025-09-16T01:59:00+00:00 ― 8 min ler

Som Novo Modelo Melhora Avaliação da Intensidade de Alimentação de Peixes

Uma abordagem unificada pra avaliar a alimentação dos peixes usando dados de áudio e vídeo.

2025-09-14T21:03:15+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões O Impacto da IA na Tecnologia de Vídeo

Descubra como a IA tá mudando a criação e o streaming de vídeo.

2025-09-13T11:18:36+00:00 ― 7 min ler

Processamento de Imagem e Vídeo Apresentando o Conjunto de Dados de Videoconferência para Comunicação no Mundo Real

Um conjunto de dados feito pra testar a qualidade de vídeo em situações de conferência.

2025-09-13T03:45:30+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Novo Framework Conecta Vídeo e Texto de Forma Mais Eficaz

Pesquisadores desenvolvem uma estrutura pra entender melhor vídeo e texto.

2025-09-12T20:49:36+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços nas técnicas de segmentação áudio-visual

Um novo método melhora a segmentação áudio-visual sem precisar de rótulos detalhados.

2025-09-12T20:28:15+00:00 ― 6 min ler

Som Novo sistema melhora a extração de voz de posições de cabeça instáveis

A PIAVE ajuda máquinas a captar vozes com clareza, mesmo quando as pessoas viram a cabeça.

2025-09-12T19:39:40+00:00 ― 7 min ler

Processamento de Áudio e Fala MusiLingo: Unindo Música e Linguagem

Um novo sistema que liga música e linguagem pra entender melhor.

2025-09-11T14:30:40+00:00 ― 7 min ler

Multimédia Design de Pôster Eficaz Através de Métricas Simples

Aprenda a criar pôsteres que transmitam mensagens de forma clara e atraente.

2025-09-09T08:49:24+00:00 ― 6 min ler

Multimédia BDIQA: Avançando a Resposta a Perguntas em Vídeo com Teoria da Mente

Um novo conjunto de dados melhora a capacidade da IA de interpretar o comportamento humano em vídeos.

2025-09-09T07:30:24+00:00 ― 8 min ler

Interação Homem-Computador Spica: Uma Nova Ferramenta para Usuários Cegos

A Spica melhora o acesso a vídeos para usuários cegos e com baixa visão através da interatividade.

2025-09-09T06:43:00+00:00 ― 5 min ler

Robótica Testando Robôs para Desafios Inesperados

Explorando métodos pra melhorar o desempenho de robôs em ambientes imprevisíveis.

2025-09-09T02:53:54+00:00 ― 6 min ler

Som Avanços na Tecnologia de Conversão de Voz Usando Imagens Faciais

Novo método transforma vozes usando características faciais para várias aplicações.

2025-09-09T01:46:55+00:00 ― 10 min ler

Processamento de Áudio e Fala Apresentando o AV-SUPERB: Um Novo Padrão para Modelos Audiovisuais

AV-SUPERB avalia modelos de áudio e vídeo em várias tarefas pra melhorar o desempenho.

2025-09-08T22:32:35+00:00 ― 6 min ler