Latest Articles for Computer Vision

Computer Vision and Pattern Recognition Creating Smart Agents for Visual Interaction

A method to generate questions from images and captions for better AI interaction.

2025-11-01T11:45:06+00:00 ― 5 min read

Computer Vision and Pattern Recognition Advancements in Vision Transformers with Shift Equivariance

New methods improve accuracy and consistency in image recognition models.

2025-11-01T07:56:00+00:00 ― 6 min read

Computer Vision and Pattern Recognition Advancing Adversarial Training with AROID Method

A novel approach using instance-wise data augmentation for better adversarial model robustness.

2025-11-01T05:25:54+00:00 ― 6 min read

Computer Vision and Pattern Recognition Improving Image Analysis Efficiency with Token Pruning

A new method enhances Vision Transformers for better image understanding with fewer resources.

2025-11-01T03:59:00+00:00 ― 5 min read

Robotics Optimizing Viewpoints in Robot Vision Systems

A structured approach for effective sensor positioning in robotic vision tasks.

2025-11-01T02:55:48+00:00 ― 5 min read

Computer Vision and Pattern Recognition Integrating 3D Control in Diffusion Models

A new method enhances image realism through 3D shape control in diffusion models.

2025-10-31T23:46:12+00:00 ― 6 min read

Computer Vision and Pattern Recognition Enhancing Visual Question Answering with User-Guided Systems

AVIS system improves visual question answering through structured workflows and transition graphs.

2025-10-31T21:16:06+00:00 ― 6 min read

Computer Vision and Pattern Recognition Advancing Pedestrian Detection with Event Cameras

Exploring the potential of event cameras in enhancing pedestrian detection for autonomous vehicles.

2025-10-31T19:22:40+00:00 ― 5 min read

Computer Vision and Pattern Recognition GeneCIS: Advancing Conditional Image Similarity in Computer Vision

A benchmark for assessing image similarity based on user-defined conditions.

2025-10-31T19:09:42+00:00 ― 6 min read

Computer Vision and Pattern Recognition Advancements in Depth Estimation from Dual-Pixel Images

New method improves depth estimation using dual-pixel sensors in various imaging devices.

2025-10-31T18:46:00+00:00 ― 5 min read

Computer Vision and Pattern Recognition Reconstructing 3D Models from 2D Images

A method to create realistic 3D shapes using only 2D data.

2025-10-31T18:06:30+00:00 ― 6 min read

Computer Vision and Pattern Recognition Improved Text Removal Method for Images

A new method enhances text removal techniques in images.

2025-10-31T17:42:48+00:00 ― 4 min read

Computer Vision and Pattern Recognition Adversarial Patches: A Threat to Object Detection

Adversarial examples can confuse object detection systems, revealing security gaps.

2025-10-31T16:47:30+00:00 ― 5 min read

Computer Vision and Pattern Recognition E2E-LOAD: Advancing Real-Time Action Detection

A new model enhances action detection speed and accuracy in real-time video analysis.

2025-10-31T15:20:36+00:00 ― 7 min read

Computation and Language Understanding the Issue of Anisotropy in Transformers

Anisotropy affects the performance of Transformer models across various data types.

2025-10-31T14:33:12+00:00 ― 5 min read

Computer Vision and Pattern Recognition Improving Vision and Language Models for Better Understanding

A new method enhances how models grasp image-text relationships.

2025-10-31T12:42:36+00:00 ― 6 min read

Machine Learning OCAtari: A New Way to Teach Machines

OCAtari focuses on game objects for better machine learning.

2025-10-31T11:55:12+00:00 ― 6 min read

Computer Vision and Pattern Recognition Advancing Face Forgery Detection with Neural Architecture Search

A new method employs neural architecture search to improve face forgery detection.

2025-10-31T10:20:24+00:00 ― 6 min read

Computer Vision and Pattern Recognition Advancements in Image-Text Retrieval Systems

A new model improves the link between images and their text descriptions.

2025-10-31T09:17:12+00:00 ― 5 min read

Computer Vision and Pattern Recognition Advancements in 3D Head Avatar Creation

A new method creates lifelike 3D avatars from just one photo.

2025-10-31T08:53:30+00:00 ― 6 min read

Computer Vision and Pattern Recognition Improving Image Generation with Norm-Guided Techniques

New methods enhance quality and speed in text-to-image models.

2025-10-31T07:26:36+00:00 ― 7 min read

Computation and Language New Methods to Teach AI Language Through Images

This study explores how AI can learn words by connecting them to images.

2025-10-31T07:18:42+00:00 ― 8 min read

Computer Vision and Pattern Recognition Advancing 3D Reconstruction with RGBD Data

A new method predicts 3D shapes from single RGB images using depth data.

2025-10-31T07:02:54+00:00 ― 5 min read

Computer Vision and Pattern Recognition TomoSAM: Advancing 3D Image Segmentation

TomoSAM streamlines 3D image segmentation, enhancing efficiency and accuracy for researchers.

2025-10-31T06:39:12+00:00 ― 5 min read

Computer Vision and Pattern Recognition Bridging Sketches and 3D Shapes

Research enhances sketch recognition for improved 3D shape matching.

2025-10-31T06:15:30+00:00 ― 5 min read

Computer Vision and Pattern Recognition Advancements in 3D Object Detection with P2D

P2D improves 3D object detection in self-driving cars using motion prediction.

2025-10-31T06:07:36+00:00 ― 6 min read

Computer Vision and Pattern Recognition Advancing Light Field Super-Resolution Techniques

New methods improve image quality using real-world light field data.

2025-10-31T04:48:10+00:00 ― 6 min read

Robotics Advancing Monocular Visual-Inertial Odometry with Ground Features

Ground-VIO improves vehicle pose estimation using camera-ground relationships.

2025-10-31T02:50:06+00:00 ― 6 min read

Computer Vision and Pattern Recognition Improving Image Recognition with Global Advantage Stream

A new model enhances how machines recognize images by blending global and local features.

2025-10-31T02:34:18+00:00 ― 6 min read

Multimedia Balancing Active Learning in Multimodal Data

A new strategy ensures equal representation of data types in machine learning.

2025-10-31T02:02:42+00:00 ― 6 min read

Computer Vision and Pattern Recognition Improving Reliability in Object Detection Models

A new approach to enhance trust in object detection through reliable calibration techniques.

2025-10-31T01:23:12+00:00 ― 6 min read

Computer Vision and Pattern Recognition 3D Scene Reconstruction Through Eye Reflections

A new method reveals how eye reflections can reconstruct 3D environments.

2025-10-30T23:40:30+00:00 ― 6 min read

Computer Vision and Pattern Recognition Introducing MaskDiT: A New Approach to Diffusion Models

MaskDiT enhances diffusion model training efficiency while maintaining image quality.

2025-10-30T23:32:36+00:00 ― 7 min read

Computer Vision and Pattern Recognition Evaluating the Robustness of Visual Foundation Models in Segmentation Tasks

A study on Visual Foundation Models' performance under real-world distortions in segmentation tasks.

2025-10-30T23:24:42+00:00 ― 8 min read

Computer Vision and Pattern Recognition Advancements in Image Classification with DiffAug

DiffAug enhances image recognition systems through innovative noise techniques.

2025-10-30T23:01:00+00:00 ― 6 min read

Computer Vision and Pattern Recognition CANN: A New Approach to Visual Localization

Introducing CANN, a method for accurate visual localization using local features.

2025-10-30T22:37:18+00:00 ― 7 min read

Computation and Language Improving Text-to-Image Generation Accuracy

A new method enhances image generation from text by properly linking entities and modifiers.

2025-10-30T22:21:30+00:00 ― 5 min read

Computer Vision and Pattern Recognition Advancing Surgical Instrument Segmentation with Vision-Language Models

New methods enhance segmentation of surgical instruments for improved robotic surgeries.

2025-10-30T21:57:48+00:00 ― 6 min read

Computer Vision and Pattern Recognition Improving Computer Vision in Biomedical Research

A new method enhances image analysis for biomedical applications.

2025-10-30T21:18:18+00:00 ― 6 min read

Computer Vision and Pattern Recognition Advancing Scene Text Removal with FETNet

FETNet improves scene text removal methods for better privacy and image restoration.

2025-10-30T20:23:00+00:00 ― 5 min read