Informática - Multimédia

RSS

Visão computacional e reconhecimento de padrões O Futuro do WebXR no Metaverso

WebXR transforma a maneira como a gente interage com ambientes digitais imersivos.

2025-08-21T07:24:48+00:00 ― 10 min ler

Multimédia Avanços na Tecnologia de Lábios para Fala

Novo método melhora a síntese de fala para pessoas que não conseguem falar.

2025-08-20T20:14:25+00:00 ― 8 min ler

Linguagens de programação AniFrame: Facilitando a Programação Criativa para Iniciantes

AniFrame torna a programação de arte acessível para iniciantes com uma abordagem fácil de usar.

2025-08-19T18:40:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Síntese de Texto para Imagem para Legendas de Notícias

Novo conjunto de dados melhora a geração de imagens a partir de legendas de notícias complexas.

2025-08-19T17:13:48+00:00 ― 8 min ler

Multimédia Verificando Fatos sobre Desinformação nas Redes Sociais

Um novo método melhora a checagem de fatos sobre as afirmações nas redes sociais.

2025-08-19T05:30:42+00:00 ― 8 min ler

Multimédia Apresentando o Shotit: Uma Nova Maneira de Buscar Vídeos

O Shotit permite que os usuários encontrem vídeos rapidinho usando imagens, facilitando o processo de busca.

2025-08-18T10:01:30+00:00 ― 7 min ler

Recuperação de informação Melhorando Recomendações em Cenários de Cold-Start

Uma nova estrutura pra melhorar recomendações sem dados prévios.

2025-08-17T21:15:12+00:00 ― 9 min ler

Multimédia Pegasus-1: Um Novo Modelo para Entender Vídeos

O Pegasus-1 permite que os usuários interajam com vídeos usando linguagem natural.

2025-08-17T17:10:18+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avanços na Síntese de Cabeça Falante com o GaussianTalker

O GaussianTalker oferece sincronização labial natural e visuais de alta qualidade para vídeos de pessoas falando.

2025-08-17T09:24:12+00:00 ― 8 min ler

Multimédia Método Inovador para Reconhecimento de Caracteres em Quadrinhos

Uma nova abordagem permite que máquinas identifiquem personagens de quadrinhos sem treinamento prévio.

2025-08-17T09:00:30+00:00 ― 7 min ler

Interação Homem-Computador Tornando o Áudio Espacial Acessível para Criadores de Vídeo

A Mimosa facilita a criação de áudio espacial pra galera que faz vídeos amadores.

2025-08-17T02:33:24+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Avaliação da Qualidade de Vídeo em Conteúdo Gerado pelo Usuário

O Desafio AIS 2024 busca melhorar as avaliações de qualidade de vídeo usando deep learning.

2025-08-16T21:01:36+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Humanos Digitais Realistas: A Ascensão do GaussianTalker

O GaussianTalker transforma a interação digital com cabeças falantes super realistas.

2025-08-16T19:34:42+00:00 ― 7 min ler

Processamento de Áudio e Fala A Crescente Tendência de Legendas em Streaming

Legendas tão tão importantes pra melhorar a experiência de quem assiste nos serviços de streaming.

2025-08-16T05:18:30+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Novos Métodos para Detectar Deepfakes

Pesquisas trazem técnicas inovadoras pra melhorar a detecção de vídeos deepfake.

2025-08-14T19:39:06+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando o Conjunto de Dados 360+x para uma Compreensão de Cena Aprimorada

Um novo conjunto de dados melhora a forma como os robôs interpretam ambientes do mundo real.

2025-08-13T18:11:55+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Apresentando o UniAV: Uma Abordagem Unificada para Localização de Vídeos

UniAV combina localização de ações, detecção de som e localização de eventos audiovisuais pra uma melhor compreensão de vídeos.

2025-08-13T10:06:05+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Avanços nas Técnicas de Detecção de Objetos

Um novo método melhora o desempenho da detecção de objetos usando consultas adaptativas.

2025-08-13T07:50:18+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões O Desafio de Detectar Deepfakes

Explorando a habilidade humana de identificar vídeos deepfake em comparação com a detecção por IA.

2025-08-12T22:05:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões O Impacto da IA na Cinematografia

Explorando como a IA tá mudando os processos de produção de vídeo pra cineastas.

2025-08-12T15:38:36+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando o PEAVS: Uma Nova Maneira de Medir a Sincronização Áudio-Visual

PEAVS analisa como o áudio e o vídeo funcionam juntos pra melhorar a experiência do espectador.

2025-08-12T03:19:55+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Apresentando o CinePile: Um Novo Padrão em Compreensão de Vídeo

O CinePile desafia a compreensão de vídeos longos com 305.000 perguntas diversas.

2025-08-11T01:11:48+00:00 ― 7 min ler

Criptografia e segurança QMedShield: Protegendo Imagens Médicas com Criptografia Quântica

Um método novo que protege imagens médicas na nuvem usando técnicas quânticas avançadas.

2025-08-10T19:47:54+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Avançando na Estimativa de Porções de Comida com Modelos 3D

Um novo método melhora a precisão do rastreamento de alimentos usando modelos 3D e imagens 2D.

2025-08-10T18:56:35+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões A Importância do Contexto em Tarefas de Visão-Linguagem

Esse estudo mostra como o contexto melhora a compreensão das máquinas sobre imagens e perguntas.

2025-08-10T10:50:42+00:00 ― 8 min ler

Som SemantiCodec: O Próximo Passo em Tecnologia de Áudio

Um novo codec de áudio que oferece compressão de alta qualidade e conteúdo semântico rico.

2025-08-08T19:10:10+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando Vídeos de Rosto Falando de Forma Realista

Um estudo apresenta um novo método para criar vídeos de rosto falante sincronizados.

2025-08-08T08:17:06+00:00 ― 6 min ler

Inteligência Artificial O Futuro da Geração Multimodal com LLMs

Explore como os modelos de linguagem grande aumentam a criatividade através da geração de multimídia.

2025-08-04T21:12:12+00:00 ― 9 min ler

Interação Homem-Computador O Futuro do Esboço 3D para Designers

Explorando os benefícios do esboço 3D imersivo para arquitetos e designers.

2025-08-04T19:45:18+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Uma Nova Abordagem para Geração de Conteúdo Audiovisual

Apresentando um modelo que gera áudio e vídeo sincronizados com níveis de ruído mistos.

2025-08-04T14:45:50+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Um Modelo Simples para Geração Audio-Visual

Esse artigo fala sobre um novo modelo simples pra gerar áudio a partir de imagens e vice-versa.

2025-08-04T09:05:45+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços nos Métodos de Criação de Conteúdo 3D

Novas técnicas melhoram a qualidade e o treinamento para imagens 3D.

2025-08-04T02:30:24+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões NuNet: Uma Nova Maneira de Estimar Nutrição

A NuNet usa dados RGB e de profundidade pra fazer estimativas de nutrição melhores.

2025-08-03T08:51:48+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Abordagem Inovadora para Geração Conjunta de Áudio e Vídeo

Um novo método melhora o alinhamento de áudio e vídeo usando modelos pré-treinados.

2025-08-03T04:45:20+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando a Máscara de Atenção Aprendível para Tarefas Multimodais

Um novo método pra melhorar os mecanismos de atenção em processamento de dados complexos.

2025-08-02T16:00:36+00:00 ― 8 min ler

Multimédia IA em Streaming de Vídeo: Eficiência e Sustentabilidade

Explorando como a IA melhora o streaming de vídeo enquanto promove a eficiência energética.

2025-08-02T11:08:18+00:00 ― 8 min ler

Som Avanços na Geração de Vídeo para Áudio com Frieren

O modelo Frieren melhora a qualidade do áudio e a sincronização para vídeos.

2025-08-02T10:07:55+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Renderização de Cena Dinâmica com Gear-NeRF

O Gear-NeRF melhora a renderização de cenas 3D dinâmicas usando técnicas que sacam o movimento.

2025-08-02T05:52:18+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avanços nas Técnicas de Marca D'água para Proteção de Imagens

Novos métodos fortalecem as marcas d'água contra as ameaças modernas de edição de imagem.

2025-08-02T05:36:30+00:00 ― 10 min ler

Interação Homem-Computador Abordagens Inovadoras para Gerenciar Riscos de Calor

Um novo sistema combina dados e notícias pra uma melhor gestão do risco de calor.

2025-08-01T23:56:48+00:00 ― 6 min ler