Informática - Multimédia

RSS

Visão computacional e reconhecimento de padrões Melhorando a Atribuição de Câmeras Usando Técnicas PRNU

Novo método melhora a precisão na identificação de câmeras depois da correção das imagens.

2025-12-13T12:29:10+00:00 ― 8 min ler

Artigos mais recentes

Multimédia Abordando a Recuperação de Áudio para Documentos de Design

2025-12-13T04:23:20+00:00 ― 6 min ler

Multimédia Equilibrando Texto e Dados Visuais no Blockchain

2025-12-13T03:06:06+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando uma Nova Abordagem para Legendagem de Mudanças

2025-12-12T13:56:06+00:00 ― 7 min ler

Som LooperGP: Uma Nova Ferramenta para Performance de Música Ao Vivo

2025-12-11T23:14:20+00:00 ― 6 min ler

Som Avanços nos Métodos de Detecção de Fala Falsa

2025-12-11T16:45:40+00:00 ― 6 min ler

Artigos mais recentes

Arquitetura de redes e da Internet Avançando a Transmissão de Vídeo em VR com Computação de Borda Móvel

Este artigo fala sobre estratégias melhores para transmissão de vídeo VR usando computação em borda móvel.

2025-12-11T15:33:06+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Apresentando o MuLTI: Um Novo Modelo para Entendimento de Vídeo e Linguagem

MuLTI combina vídeo e texto de um jeito eficiente pra melhorar aplicações do dia a dia.

2025-12-11T01:43:36+00:00 ― 6 min ler

Som Avanços no Reconhecimento de Falantes com TFN

Um novo método melhora o reconhecimento de voz combinando características de tempo e frequência.

2025-12-10T09:10:55+00:00 ― 6 min ler

Multimédia Apresentando o Conjunto de Dados de Vídeo Volumétrico de Cena Completa

Um novo conjunto de dados pra estudar vídeo volumétrico em cenários da vida real.

2025-12-09T23:27:55+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avançando a IA Biomédica com Novo Conjunto de Dados

Um novo conjunto de dados preenche a lacuna na pesquisa de IA biomédica.

2025-12-09T22:59:54+00:00 ― 6 min ler

Som Avanços nas Técnicas de Representação de Áudio

Esse artigo explora os métodos mais recentes para representação de áudio e suas implicações.

2025-12-09T22:39:20+00:00 ― 7 min ler

Multimédia Melhorando a Marcação de Micro-Vídeos Através da Influência Social

Um novo modelo melhora a precisão das tags usando interações sociais e relacionamentos de tags.

2025-12-09T16:17:00+00:00 ― 6 min ler

Aprendizagem de máquinas Navegando pelos Direitos Autorais na Era da Arte AI

Explorando questões de direitos autorais relacionadas a imagens geradas por IA e métodos de proteção.

2025-12-09T04:18:06+00:00 ― 7 min ler

Criptografia e segurança Esteganografia: Escondendo Imagens em Arquivos de Áudio

Aprenda como imagens podem ser escondidas em áudio usando técnicas avançadas.

2025-12-08T22:21:50+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Lana: Uma Nova Era na Comunicação Robótica

A Lana junta navegação e explicação pra uma interação avançada entre robôs e humanos.

2025-12-08T20:47:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Geração de Imagens com o GlueGen

GlueGen transforma a forma como textos e outras entradas criam imagens.

2025-12-08T04:51:54+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avaliando a Qualidade de Imagens com Pouca Luz Através de Dados Auditivos e Visuais

Este estudo junta descrições de áudio com imagens pra avaliar a qualidade de fotos em pouca luz.

2025-12-07T20:50:00+00:00 ― 7 min ler

Inteligência Artificial A Ascensão da IA Generativa: Transformando a Criação de Conteúdo

Ferramentas de IA generativa estão mudando a forma como criamos conteúdo em várias áreas.

2025-12-06T19:41:06+00:00 ― 16 min ler

Aprendizagem de máquinas Melhorando o Aprendizado Federado Através de Protótipos

Um novo método melhora a precisão do modelo de aprendizado federado enquanto protege os dados dos usuários.

2025-12-06T07:18:30+00:00 ― 5 min ler

Interação Homem-Computador Preparando Sua Publicação ACM: Um Guia

Aprenda o básico sobre como formatar documentos para conferências e jornais da ACM.

2025-12-05T17:13:12+00:00 ― 5 min ler

Som Transformador de Áudio Causal: Avanços na Classificação de Som

Um novo modelo melhora a classificação de áudio usando técnicas avançadas.

2025-12-05T16:37:50+00:00 ― 6 min ler

Multimédia Avanços na Síntese de Texto para Imagem com FDGAN

Novo framework melhora a geração de imagens a partir de descrições em texto usando técnicas de separação.

2025-12-05T09:58:42+00:00 ― 6 min ler

Computação e linguagem Aprimorando a Classificação de Conteúdo nas Redes Sociais com Comentários de Usuários

Usando os comentários dos usuários pra melhorar a classificação de conteúdo de mídia mista.

2025-12-04T08:49:48+00:00 ― 7 min ler

Processamento de Imagem e Vídeo Uma Nova Métrica para a Qualidade de Streaming de Vídeo

Essa métrica melhora a avaliação da qualidade de vídeo em tempo real pra uma experiência de streaming melhor.

2025-12-03T20:54:20+00:00 ― 6 min ler

Som Conectando Fala e Música Através da Emoção

Um novo sistema combina música com fala com base em emoções, sem precisar de texto.

2025-12-03T16:02:50+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanço na Modelagem de Redundância Visual para Sistemas Multimídia

Uma nova abordagem para melhorar a qualidade da imagem e a eficiência da compressão.

2025-12-03T12:48:30+00:00 ― 7 min ler

Multimédia Avanços no Reconhecimento Contínuo de Emoções

Um estudo sobre como melhorar a detecção de emoções através de várias fontes de dados.

2025-12-03T11:11:20+00:00 ― 6 min ler

Processamento de Imagem e Vídeo Avanços na Avaliação da Qualidade de Imagens em Campo de Luz

Explorando novos métodos pra avaliar imagens de campo de luz sem precisar de imagens de referência.

2025-12-02T11:42:25+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Apresentando o altiro3D: Facilitando a Criação de Imagens 3D

altiro3D torna fácil e eficiente criar visuais 3D a partir de imagens 2D.

2025-12-02T05:13:00+00:00 ― 5 min ler

Processamento de Imagem e Vídeo Avanços em Codificação de Vídeo Profundo Distribuído

Um novo método pra compressão de vídeo eficiente usando técnicas de deep learning.

2025-12-01T22:45:05+00:00 ― 8 min ler

Teoria da Informação Os Fundamentos da Compressão de Vídeo

Descubra como a compressão de vídeo melhora a qualidade e a eficiência do streaming.

2025-12-01T16:07:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Combatendo Fake News: Uma Nova Abordagem

Um novo sistema melhora a detecção de notícias falsas nas comunicações online.

2025-12-01T14:12:24+00:00 ― 5 min ler

Multimédia Apresentando o AIOZ-GDANCE: Um Novo Conjunto de Dados para Geração de Dança em Grupo

AIOZ-GDANCE promove pesquisas pra criar movimentos de dança em grupo baseados em música.

2025-12-01T11:24:55+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Designer de Roupas Multimodal: Uma Nova Abordagem para Imagens de Moda

Um sistema que gera imagens de moda usando texto, esboços e poses.

2025-12-01T09:12:12+00:00 ― 10 min ler

Visão computacional e reconhecimento de padrões Avanços em Localizar Sons em Vídeos

Pesquisas melhoram a habilidade das máquinas de localizar objetos que fazem barulho em vídeos.

2025-12-01T02:30:30+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Melhorando as Técnicas de Segmentação Audiovisual

Novos métodos visam melhorar como os modelos conectam sons a visuais.

2025-11-30T15:09:54+00:00 ― 7 min ler

Multimédia Um Método Unificado para Avaliar a Qualidade do Vídeo

Apresentando o XGC-VQA pra avaliar a qualidade de vídeo de forma eficaz em vários tipos de conteúdo.

2025-11-30T10:18:50+00:00 ― 6 min ler

Arquitetura de redes e da Internet Entrega de Dados Confiável para Conectividade Moderna

Um novo método melhora a transmissão de dados mesmo com conexões de internet instáveis.

2025-11-30T00:40:54+00:00 ― 6 min ler

Inteligência Artificial Uma Nova Estrutura para Anotações Musicais

Este artigo fala sobre uma abordagem sistemática para a anotação de música.

2025-11-28T06:29:30+00:00 ― 7 min ler

Inteligência Artificial Entendendo a Ontologia das Notas Musicais

Uma abordagem estruturada pra representação musical e análise de performance.

2025-11-28T05:40:55+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Criando Imagens a Partir de Sons: O Modelo Sound2Scene

Novo modelo transforma sons em imagens claras, unindo informações auditivas e visuais.

2025-11-28T03:15:10+00:00 ― 7 min ler

Processamento de Áudio e Fala Novo Método de Legenda para Áudio com Dados Limitados

Uma nova abordagem pra gerar legendas de áudio usando modelos de linguagem pré-treinados.

2025-11-28T02:26:35+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços nas Técnicas de Hashing Multivisual

Novo método melhora a recuperação de multimídia ao combinar vários tipos de dados de forma eficaz.

2025-11-27T17:46:36+00:00 ― 6 min ler

Multimédia Conectando Imagens de Comida a Receitas de Diversas Culinárias

Um novo método liga imagens de comida e receitas de várias culinárias.

2025-11-27T14:05:24+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando a Detecção de Objetos em Vídeos Codificados

Um jeito de aumentar a precisão do reconhecimento de objetos em vídeos usando técnicas de processamento avançadas.

2025-11-26T22:54:45+00:00 ― 7 min ler