Artigos mais recentes para Visão Computacional

Visão computacional e reconhecimento de padrões Revolucionando a Estimativa de Fluxo de Cena com GMSF

GMSF traz uma nova maneira de estimar movimento em 3D.

2025-11-08T15:34:36+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Reconstrução de Objetos Reflexivos

Novos métodos melhoram a reconstrução 3D de superfícies reflexivas usando técnicas de renderização neural.

2025-11-08T14:31:24+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Examinando o Papel da Consulta nos Transformers

Esse artigo investiga a necessidade do componente de consulta nos modelos de transformer.

2025-11-08T12:17:06+00:00 ― 4 min ler

Aprendizagem de máquinas Avançando Técnicas de Geração de Dados Cross-Modal

Um novo modelo melhora a geração de dados a partir de vários tipos de entrada.

2025-11-08T11:45:30+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões T2FNorm: Uma Nova Abordagem para Detecção de OOD

O T2FNorm melhora a habilidade das redes neurais de detectar dados desconhecidos.

2025-11-08T09:15:24+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Um Guia Prático para YOLO na Detecção de Objetos

Aprenda sobre o YOLO para detecção de objetos em tempo real.

2025-11-08T09:07:30+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Construindo um Sistema de Detecção de Rodas de Veículos com YOLOv5

Aprenda a criar um sistema que identifica rodas de veículos em diferentes condições.

2025-11-08T08:59:36+00:00 ― 8 min ler

Robótica Avançando o Aprendizado de Robôs com Dados Visuais

Pesquisadores usam imagens pra ensinar os robôs a interagir com o mundo.

2025-11-08T08:51:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Localização de Objetos 3D para Carros Autônomos

Novo framework melhora a precisão da localização de objetos 3D usando uma única câmera.

2025-11-08T08:20:06+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avaliando Deep Learning: Lógica em Ilusões Visuais

Este estudo analisa como modelos de deep learning interpretam lógica em diagramas usando ilusões visuais.

2025-11-08T07:56:24+00:00 ― 8 min ler

Computação e linguagem HaVQA: Avançando a Língua Hausa na IA

Novo conjunto de dados melhora a capacidade de perguntas sobre imagens no processamento da língua Hausa.

2025-11-08T07:09:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Apresentando a Caterpillar: Uma Nova Abordagem em Visão Computacional

Caterpillar é uma nova arquitetura MLP pra captar detalhes locais de imagem.

2025-11-08T06:13:42+00:00 ― 8 min ler

Visão computacional e reconhecimento de padrões Otimizando o Desempenho de CNNs 3D em Dispositivos FPGA

Uma nova abordagem para rodar modelos X3D em FPGAs para análise de vídeo eficiente.

2025-11-08T05:34:12+00:00 ― 8 min ler

Aprendizagem de máquinas Aproveitando Modelos de Difusão para Treinamento de Modelos Geradores

Um framework pra melhorar modelos generativos usando modelos de difusão pré-treinados.

2025-11-08T05:10:30+00:00 ― 8 min ler

Aprendizagem automática Combinando Métodos de Kernel e Aprendizado Profundo

Uma nova abordagem integra métodos de kernel com aprendizado profundo pra um desempenho melhor.

2025-11-08T04:48:08+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando Modelos de Visão-Linguagem com Feedback do CLIP

Um novo método melhora modelos de visão-linguagem com feedback em tempo real pra ter um desempenho melhor.

2025-11-08T04:38:54+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços na Compreensão de Documentos com LayoutMask

O LayoutMask melhora a interação com texto e layout pra uma compreensão melhor dos documentos.

2025-11-08T03:35:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Geração Eficiente de Grafos de Cena

Uma nova abordagem pra melhorar a geração de grafos de cena pra uma melhor compreensão visual.

2025-11-08T02:08:48+00:00 ― 12 min ler

Visão computacional e reconhecimento de padrões Apresentando o PaLI-X: Um Novo Modelo de Visão-Linguagem

PaLI-X combina habilidades de visão e linguagem, se destacando em várias tarefas.

2025-11-08T00:34:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avaliação de Métodos para Reconhecer Formas 3D Rotacionadas

Este estudo avalia diferentes técnicas para detectar formas 3D em rotação.

2025-11-08T00:18:12+00:00 ― 9 min ler

Aprendizagem de máquinas Avanços em Redes de Grupos Lineares

Novas redes neurais aprendem transformações direto dos dados, melhorando a eficiência e a compreensão das simetrias.

2025-11-07T23:54:30+00:00 ― 8 min ler

Computação e linguagem SlimFit: Uma Solução para Problemas de Memória em Modelos Transformer

SlimFit reduz o uso de memória para modelos transformer durante o ajuste fino.

2025-11-07T23:38:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões LaFTer: Uma Nova Abordagem para Modelos de Visão e Linguagem

Esse método melhora modelos de visão e linguagem sem precisar de imagens rotuladas.

2025-11-07T21:56:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando a Detecção de Objetos com Entendimento Contextual

Novo método melhora a capacidade dos modelos de IA de detectar objetos usando contexto.

2025-11-07T21:48:06+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Melhorando Transformadores de Visão com Taxa de Compressão Diferenciável

Um método pra melhorar a eficiência em transformers de visão sem perder desempenho.

2025-11-07T18:06:54+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões Avanços em Aprendizado Zero-Shot Composicional

Nova abordagem melhora como a IA reconhece combinações únicas de atributos e objetos.

2025-11-07T17:35:18+00:00 ― 5 min ler

Visão computacional e reconhecimento de padrões ReSup: Uma Nova Abordagem para Rótulos Estrondosos no Reconhecimento de Expressões Faciais

ReSup melhora o reconhecimento de emoções ao lidar de forma eficaz com rótulos ruidosos.

2025-11-07T16:40:00+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços em Correspondência Densa através da Difusão Condicional

Novo framework melhora a correspondência de imagens para diversas aplicações em visão computacional.

2025-11-07T15:28:54+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços em Sistemas de Múltiplas Câmeras para Veículos Autônomos

Occ-BEV melhora a percepção do veículo por meio de modelagem 3D com várias câmeras e integração de dados.

2025-11-07T14:57:18+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Reduzindo os Vision Transformers pra Uso em Dispositivos Móveis

Uma análise de Transformers de Visão menores que são adequados para aplicativos móveis.

2025-11-07T12:03:30+00:00 ― 6 min ler

Aprendizagem de máquinas Avançando a Análise de Dados com Pooling Global Invariante de Grupo

Um novo método melhora como a gente processa dados complexos, reconhecendo simetrias.

2025-11-07T10:36:36+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avançando a Reconstrução 3D com Imagens Limitadas

Um novo método combina NeRF e MDE pra melhorar a modelagem 3D com poucas imagens.

2025-11-07T10:20:48+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Testando Modelos de Visão Computacional para Desafios do Mundo Real

Métodos inovadores revelam vulnerabilidades em modelos de reconhecimento de imagem.

2025-11-07T09:41:18+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Apresentando o DisCLIP: Uma Nova Abordagem para Geração de Expressões Referenciais

DisCLIP melhora a precisão das descrições de imagem usando modelos visuais-linguísticos avançados.

2025-11-07T08:53:54+00:00 ― 9 min ler

Visão computacional e reconhecimento de padrões Um Novo Modelo para Processamento de Dados Multi-Modais

Apresentando um modelo que integra vários tipos de dados para tarefas complexas.

2025-11-07T05:13:30+00:00 ― 6 min ler

Computação e linguagem Avançando a Resposta a Perguntas Visuais com uma Nova Abordagem

Um novo método melhora a precisão de Respostas a Perguntas Visuais usando conhecimento externo.

2025-11-07T05:12:42+00:00 ― 6 min ler

Visão computacional e reconhecimento de padrões Avanços na Estimação de Pose Humana a partir de Vídeo

Um novo método melhora a precisão na estimativa de poses humanas a partir de vídeo.

2025-11-07T04:25:18+00:00 ― 6 min ler

Aprendizagem de máquinas Abordando o Reconhecimento de Cauda Longa com WCDAS

Um novo método melhora a precisão ao reconhecer classes menos comuns em conjuntos de dados desbalanceados.

2025-11-07T03:53:42+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avançando a Adaptação de Domínio com VAEGAN

Um novo modelo enfrenta os desafios da adaptação de domínio para aprendizado de máquina.

2025-11-07T02:11:00+00:00 ― 7 min ler

Visão computacional e reconhecimento de padrões Avanços no Reconhecimento de Caligrafia em Bangla

Um novo método melhora a precisão do reconhecimento de escrita à mão em Bangla.

2025-11-07T01:55:12+00:00 ― 6 min ler