Artigos mais recentes para Visão Computacional

Aprendizagem de máquinas Navegando na Generalização Fora da Distribuição em Modelos de IA

Como modelos pré-treinados impactam o desempenho em novos dados.

2025-10-19T14:04:18+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços em Patches Adversariais para Detecção de Objetos

Novo método melhora os patches adversariais, misturando eficácia com aparência natural.

2025-10-19T11:26:18+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Apresentando o SEED: Uma Nova Ferramenta para Imagens e Texto

SEED conecta imagens e texto, melhorando como as máquinas processam informações visuais e escritas.

2025-10-19T11:02:36+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Detecção de Objetos Usando Movimento e Profundidade

Novo método melhora a detecção de vários objetos em movimento em imagens.

2025-10-19T10:38:54+00:00 ― 5 min ler

Aprendizagem de máquinas Avanços em Modelos com Peso para Tarefas Visuais

Explorando o potencial de modelos de peso amarrado com múltiplas máscaras em aprendizado de máquina.

2025-10-19T10:07:18+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Melhorando a Detecção de Objetos 3D em Diferentes Ambientes

Um novo framework melhora a detecção de objetos 3D ao lidar com os desafios de adaptação de domínio.

2025-10-19T09:19:54+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando a Correspondência de Gráficos Não Supervisionada com Consistência de Ciclo

Novo método melhora a correspondência de grafos sem dados rotulados usando consistência de ciclos.

2025-10-19T09:04:06+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Melhorando Modelos de Visão-Linguagem com Resumos Eficientes

Um novo método melhora a eficiência e o desempenho em tarefas de visão-linguagem.

2025-10-19T07:53:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Representação de Características de Riesz na Classificação de Imagens

Uma nova técnica para classificar imagens de forma mais eficiente com poucos dados.

2025-10-19T07:45:06+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Simplificando a Compreensão de Vídeo com Operações Aritméticas

Um novo método usa matemática básica pra analisar conteúdo de vídeo de forma eficaz.

2025-10-19T05:46:36+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Adaptando Modelos de Visão Computacional para Uso Noturno

Novo método melhora a visão computacional em pouca luz sem dados de treinamento à noite.

2025-10-19T03:24:24+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Modelos de Difusão na Classificação de Imagens

Explorando modelos de difusão para geração e classificação de imagens.

2025-10-19T02:52:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços em Modelos de Linguagem Multimodais

Um novo modelo melhora as conexões entre texto, imagens e áudio.

2025-10-19T01:18:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando o Transformer de Modulação Consciente de Escala

Um novo modelo que melhora o desempenho em tarefas visuais ao combinar CNNs e Transformers.

2025-10-19T01:10:06+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Detecção de Objetos 3D Monoculares

O framework MonoLiG melhora a detecção 3D usando câmeras monoculares e dados de LiDAR.

2025-10-18T23:35:18+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões NORIS: Um Novo Método para Aprendizado Ativo em Detecção de Objetos

A NORIS melhora a seleção de imagens pra treinar modelos de detecção de objetos de forma eficiente.

2025-10-18T23:27:24+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avanços na Estimativa de Profundidade para Qualquer Clima

Robust-Depth melhora a estimativa de profundidade em diferentes condições climáticas.

2025-10-18T21:52:36+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Melhorando a Geração de Imagens Condicionais com Dados Ruins

Um novo método melhora a geração de imagens usando dados rotulados e não rotulados que são menos confiáveis.

2025-10-18T21:21:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Segmentação de Objetos em Vídeo com o Framework HST

A estrutura HST mostra melhorias significativas no rastreamento de objetos entre os quadros do vídeo.

2025-10-18T20:17:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Apresentando o Conjunto de Dados LOAF para Detecção de Pessoas

LOAF oferece um novo conjunto de dados para detectar pessoas usando câmeras olho de peixe instaladas no teto.

2025-10-18T20:02:00+00:00 ― 8 min ler

Computação e linguagem Avanços em Resposta a Perguntas Visuais com PAT

Um novo método melhora como as máquinas respondem perguntas sobre imagens.

2025-10-18T19:54:06+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando o CLIP com SDS-CLIP pra um raciocínio melhor

SDS-CLIP melhora as habilidades de raciocínio imagem-texto do CLIP.

2025-10-18T19:30:24+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando o RepViT: Um Modelo de Visão Leve para Dispositivos Móveis

RepViT combina CNNs e ViTs pra aplicações de visão móvel eficientes.

2025-10-18T18:43:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços no Reconhecimento de Ação Humana com ConViT

O modelo ConViT melhora o reconhecimento de ações humanas em imagens paradas usando deep learning.

2025-10-18T18:19:18+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços em Perguntas e Respostas Visuais com o Conjunto de Dados GenVQA

Pesquisas mostram que um novo conjunto de dados tá melhorando o desempenho dos modelos de VQA com o tempo.

2025-10-18T17:39:48+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Apresentando o OnlineRefer: Uma Revolução na Segmentação de Objetos em Vídeo

OnlineRefer melhora a segmentação de objetos em vídeo conectando os quadros por meio da propagação de consultas.

2025-10-18T13:34:54+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avaliando Modelos VQA para Carros Autônomos

Este estudo avalia a eficácia dos modelos de VQA em cenários de direção.

2025-10-18T13:11:12+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando a Ancoragem Visual 3D com Supervisão Fraca

Um método para ancoragem visual 3D usando anotações mínimas.

2025-10-18T12:47:30+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços na Reidentificação de Pessoas com Redes de Atenção em Grafos

Uma nova abordagem melhora a identificação de indivíduos em imagens com extração de características avançadas.

2025-10-18T12:08:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando o LW PLG-ViT: Um Transformer de Visão Leve

LW PLG-ViT oferece um desempenho eficiente para tarefas visuais em dispositivos com recursos limitados.

2025-10-18T11:12:42+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Melhorando a Estimação de Pose Humana em 3D com Sugestões de Ação

Um novo módulo melhora a estimativa de pose 3D ao integrar informações de ação.

2025-10-18T10:09:30+00:00 ― 6 min ler

Inteligência Artificial Melhorando a Regressão Ordinal com Ord2Seq

Um novo método melhora a regressão ordinal ao diferenciar melhor categorias próximas.

2025-10-18T09:53:42+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Melhorando a Análise de Nuvens de Pontos 3D com o DBPnet

Um novo método melhora as nuvens de pontos pra uma análise 3D melhor.

2025-10-18T09:37:54+00:00 ― 5 min ler

Robótica Avanços na Estimativa de Profundidade Multi-Modal para Robôs

Este artigo fala sobre um novo modelo pra melhorar a percepção de profundidade em robôs usando vários sensores.

2025-10-18T06:52:00+00:00 ― 10 min ler

Aprendizagem de máquinas Melhorando os Dados de Treinamento com Legendas Sintéticas

Legendas melhores podem melhorar o desempenho de modelos multimodais usando imagens da web.

2025-10-18T05:01:24+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Novo Conjunto de Dados para Renderização Centrada no Humano

Um conjunto de dados revolucionário tem como objetivo melhorar a precisão da renderização humana em mídias digitais.

2025-10-18T04:29:48+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços em Segmentação Semântica Usando BRPG

Um novo método melhora a eficiência da segmentação semântica da IA com menos exemplos rotulados.

2025-10-18T03:02:54+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Aprimorando o Deep Learning com Consciência da Incerteza

Uma nova abordagem melhora a confiabilidade do modelo de deep learning ao medir a incerteza.

2025-10-18T01:36:00+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Avançando a Localização de Objetos com Modelo de Prompt Generativo

Uma nova abordagem melhora a localização de objetos ao focar na aparência geral.

2025-10-17T22:34:18+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Point Intrinsic Net: Uma Nova Abordagem para Decomposição de Imagem

Apresentando o PoInt-Net para decomposição avançada de imagens intrínsecas usando nuvens de pontos 3D.

2025-10-17T21:31:06+00:00 ― 11 min ler