Informática - Multimédia

RSS

Multimédia Revolucionando o Monitoramento do Sono de Bebês com o LittleBeats

Estudo usa dispositivo multi-dados pra rastrear padrões de sono de bebês de forma mais precisa.

2025-10-16T17:25:55+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Melhorando a Anotação de Imagens com o Método vTelos

Uma nova abordagem pra melhorar a precisão da etiquetagem de imagens em aprendizado de máquina.

2025-10-15T08:57:06+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Reconhecimento Eficiente de Ação em Vídeo com Menos Quadros

Um novo método melhora o reconhecimento de ações usando menos quadros sem perder o contexto importante.

2025-10-14T23:36:12+00:00 ― 10 min ler

Visão computacional e reconhecimento de padrões Melhorando a Geração de Imagens a partir de Descrições em Texto

Um novo método melhora como as imagens combinam com entradas de texto.

2025-10-14T14:00:56+00:00 ― 7 min ler

Bases de dados O Impacto da Blockchain na Gestão de Direitos Autorais

Explorando como a tecnologia blockchain pode transformar a gestão de direitos autorais para os criadores.

2025-10-14T07:24:30+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Método Inovador de Smartphone para Monitorar a Desnutrição

Uma nova forma de avaliar a saúde usando só uma imagem do smartphone.

2025-10-13T21:47:48+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Simplificando a Rotulagem de Vídeo com Análise Visual

Uma nova ferramenta facilita o processo de rotulação de dados de vídeo de forma eficiente.

2025-10-13T11:00:00+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Entendendo Emoções em Imagens com StyleEDL

Um novo método combina estilo e conteúdo de imagem pra interpretar emoções com precisão.

2025-10-12T03:24:00+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Edição de Texto em Cena com o FAST

O FAST revoluciona a edição de texto em cena com modificações naturais e flexibilidade.

2025-10-12T01:17:36+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Geração de Formas 3D Usando Desenhos e Texto

Um novo método combina desenhos e texto pra melhorar a geração de formas 3D.

2025-10-12T00:46:00+00:00 ― 9 min ler

Multimédia Protegendo os Direitos Autorais em Serviços de Prompt

Um novo modelo pra proteger os direitos dos criadores de prompts em ferramentas de IA.

2025-10-11T23:42:48+00:00 ― 7 min ler

Multimédia Avanços nos Métodos de Pré-treinamento de Visão-Linguagem

Uma nova abordagem melhora a eficiência em tarefas de pré-treinamento de Visão-Linguagem.

2025-10-11T17:07:48+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando a Criação de Vídeos com o DiffSynth

O DiffSynth melhora a qualidade do vídeo reduzindo a piscada e melhorando a mistura de quadros.

2025-10-11T07:46:54+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços em Redes Neurais Espinhadas: Compressão de Modelo com Otimização Minimax

Uma olhada em como a Otimização Minimax melhora a eficiência das Redes Neurais de Pulsos.

2025-10-11T03:18:18+00:00 ― 7 min ler

Multimédia Jade: Uma Nova Abordagem para a Qualidade de Streaming de Vídeo

Jade melhora a qualidade do vídeo com base no feedback dos usuários e em técnicas de streaming adaptativo.

2025-10-10T17:57:24+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Modelo Inovador para Seleção de Cores no Design

Um novo modelo recomenda cores com base em elementos de design e texto.

2025-10-10T17:49:30+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Transferindo Movimentos das Mãos Entre Avatares

Um novo método melhora a comunicação por gestos para avatares com formas de mão únicas.

2025-10-10T04:39:30+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Perguntas e Respostas Audiovisuais: Unindo Som e Visão

A AVQA liga elementos de áudio e visual em vídeos pra responder perguntas.

2025-10-09T23:47:12+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando o Animador de Rosto Versátil para Animação 3D

Um novo método pra criar animações faciais 3D realistas de forma rápida e eficiente.

2025-10-09T16:32:42+00:00 ― 6 min ler

Criptografia e segurança Avanços em Esteganografia de Vídeo e Detecção

Novos métodos melhoram a detecção de mensagens ocultas em arquivos de vídeo.

2025-10-09T09:34:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Transformando Crânios em Imagens de Animais Vivos

Um método pra traduzir imagens de crânios em representações realistas de animais usando prompts de texto.

2025-10-08T21:43:00+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços na Análise de Vídeo em Tempo Real

Novos métodos melhoram a detecção de eventos em vídeos em streaming usando linguagem e dados históricos.

2025-10-08T18:57:06+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Novo Método para Detectar Memes Odiosos

Uma nova abordagem melhora a detecção de memes prejudiciais usando perguntas direcionadas.

2025-10-08T12:22:06+00:00 ― 9 min ler

Multimédia EMID: Uma Nova Abordagem para Música e Imagens

Explore os laços emocionais entre música e imagens com o dataset EMID.

2025-10-08T07:45:36+00:00 ― 6 min ler

Processamento de Imagem e Vídeo Reconstruindo Imagens Visuais a Partir de Sinais Cerebrais

Essa pesquisa conecta a atividade cerebral à percepção visual ao reconstruir imagens a partir dos sinais de EEG.

2025-10-08T06:54:00+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Conectando Palavras a Imagens: Fundamentos Visuais Desbloqueados

Descubra o impacto do ancoramento visual nas interações entre linguagem e imagem.

2025-10-07T08:43:06+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avançando o Reconhecimento de Vídeo com AVGN

Um novo método aumenta a eficiência no reconhecimento de vídeo usando dados de áudio e visuais.

2025-10-07T00:09:36+00:00 ― 6 min ler

Inteligência Artificial Avanços em IA para Teste de Jogos

Um novo agente de IA melhora a eficiência e a qualidade dos testes de jogos.

2025-10-06T23:38:00+00:00 ― 7 min ler

Multimédia Apresentando o Dronevision: Um Sistema de Display 3D Compacto

A Dronevision tá revolucionando o multimedia 3D com um display do tamanho de uma mesa usando drones voadores.

2025-10-06T22:03:12+00:00 ― 8 min ler

Multimédia Avaliação de Sensores de Distância para Pontinhos de Luz Voadores

Um estudo sobre sensores essenciais para o desempenho de novos drones.

2025-10-06T21:55:18+00:00 ― 5 min ler

Recuperação de informação Avançando Sistemas de Recomendação com Dados Multi-Modais

Um novo framework melhora as sugestões de itens usando diferentes tipos de dados.

2025-10-05T12:52:24+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões EVE: Uma Nova Abordagem para Modelos de Linguagem e Visão

Descubra a EVE, um modelo que melhora a compreensão de imagens e texto.

2025-10-05T11:09:42+00:00 ― 7 min ler

Multimédia Avanços nos Modelos de Pré-treinamento de Visão-Linguagem

A pesquisa foca em melhorar modelos que ligam visuais e texto através da compreensão de linguagem.

2025-10-04T21:51:48+00:00 ― 7 min ler

Interação Homem-Computador Avanços na Geração de Gestos para Comunicação com IA

Novo modelo melhora a geração de gestos para interações mais parecidas com humanas.

2025-10-04T05:32:12+00:00 ― 6 min ler

Multimédia Avanços em Combinação Visual Acústica

Um novo método melhora a correspondência de áudio usando imagens, aumentando o realismo em ambientes de áudio.

2025-10-03T03:55:25+00:00 ― 8 min ler

Aprendizagem de máquinas Os Riscos da Esteganografia em Aprendizado de Máquina

Analisando preocupações com dados ocultos em modelos de machine learning e suas implicações de segurança.

2025-10-03T03:12:12+00:00 ― 8 min ler

Processamento de Áudio e Fala Novo Conjunto de Dados Liga Emoções à Música MIDI

Um conjunto de dados liga emoções a músicas MIDI analisando as letras das canções.

2025-10-03T02:18:15+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando o TextVQA com o Método Separar e Localizar

Uma nova abordagem melhora a precisão ao responder perguntas sobre textos em imagens.

2025-10-02T16:40:12+00:00 ― 6 min ler

Multimédia Avanços em Perguntas e Respostas Visuais com PROOFREAD

O PROOFREAD melhora a resposta a perguntas visuais usando conhecimento de grandes modelos de linguagem.

2025-10-02T08:30:24+00:00 ― 7 min ler

Som Avançando a Legendagem Musical com Modelos de Linguagem Grandes

Usando LLMs pra criar um dataset gigante pra legendagem de música.

2025-10-02T08:29:25+00:00 ― 7 min ler