Latest Articles for Computer Vision

Computer Vision and Pattern Recognition VideoGLaMM: Connecting Words and Pictures in Videos

VideoGLaMM enhances video understanding through detailed visual and textual connections.

Shehan Munasinghe, Hanan Gani, Wenqi Zhu

May 28, 2025 ― 7 min read

Computer Vision and Pattern Recognition Advancements in Facade Semantic Segmentation

A new approach improves building part identification for smarter urban planning.

Olaf Wysocki, Yue Tan, Thomas Froech

May 28, 2025 ― 7 min read

Machine Learning Advancements in Self-Supervised Learning with SimCLR

SimCLR enhances model training using unlabeled data in vision tasks.

Han Zhang, Yuan Cao

May 28, 2025 ― 7 min read

Machine Learning Unraveling Network Fragmentation in Deep Learning

A look into network fragmentation and its impact on model performance.

Coenraad Mouton, Randle Rabe, Daniël G. Haasbroek

May 28, 2025 ― 7 min read

Computer Vision and Pattern Recognition Advancements in 3D Pose Estimation Techniques

A new approach improves accuracy in 3D pose estimation for machines.

Jongmin Lee, Minsu Cho

May 28, 2025 ― 7 min read

Computer Vision and Pattern Recognition Assessing Large Multimodal Models' Spatial Reasoning

Researchers investigate the spatial reasoning skills of Large Multimodal Models.

Fatemeh Shiri, Xiao-Yu Guo, Mona Golestan Far

May 27, 2025 ― 7 min read

Computer Vision and Pattern Recognition Improving Image Recognition with GCI-ViTAL

A new method enhances image learning despite label noise.

Moseli Mots'oehli, kyungim Baek

May 27, 2025 ― 4 min read

Robotics Simplifying Robot Navigation with Vision-Language Models

A look at how VLM improves robot navigation tasks.

Dylan Goetting, Himanshu Gaurav Singh, Antonio Loquercio

May 27, 2025 ― 8 min read

Neural and Evolutionary Computing New Model Mimics Human Eye Processing

R-JEPA learns to process images like our brains, improving computer vision.

Osvaldo M Velarde, Lucas C Parra

May 27, 2025 ― 7 min read

Computer Vision and Pattern Recognition Advances in Semi-Supervised Domain Adaptation

A novel approach enhances model learning from varied image data.

Xinyang Huang, Chuang Zhu, Bowen Zhang

May 26, 2025 ― 7 min read

Machine Learning Advancements in Few-Shot Class Incremental Learning

This article discusses the role of graphs in few-shot class incremental learning.

Yayong Li, Peyman Moghadam, Can Peng

May 26, 2025 ― 4 min read

Computer Vision and Pattern Recognition Simplifying Image Segmentation with Superpixels

Learn how superpixel segmentation makes image analysis easier for machines.

Rémi Giraud, Michaël Clément

May 26, 2025 ― 6 min read

Computer Vision and Pattern Recognition Revamping UHD Image Restoration with D2Net

D2Net offers a new way to enhance UHD images effectively.

Chen Wu, Ling Wang, Long Peng

May 26, 2025 ― 6 min read

Computer Vision and Pattern Recognition Advancements in Multi-Object Tracking with PKF

PKF improves object tracking accuracy in complex environments.

Hanwen Cao, George J. Pappas, Nikolay Atanasov

May 26, 2025 ― 5 min read

Computer Vision and Pattern Recognition Creating a Lightweight Xception Model for Edge Devices

A new version of Xception that works efficiently on limited devices.

Md Arid Hasan, Krishno Dey

May 26, 2025 ― 8 min read

Computer Vision and Pattern Recognition Advancements in Depth Estimation Using Equivariance

A new method enhances depth estimation for robotics and computer vision.

Yinshuang Xu, Dian Chen, Katherine Liu

May 26, 2025 ― 5 min read

Robotics Improving Video Models for Robot Learning

A new method helps robots learn actions from videos without a lot of data.

Yunhao Luo, Yilun Du

May 25, 2025 ― 6 min read

Computer Vision and Pattern Recognition Advancing Person Recognition with Clothing Variations

A new framework enhances identification by generating varied clothing images.

Nyle Siddiqui, Florinel Alin Croitoru, Gaurav Kumar Nayak

May 25, 2025 ― 6 min read

Computer Vision and Pattern Recognition Advancements in Diffusion Models for Image Processing

Diffusion models enhance machine vision for depth, movement, and hidden object detection.

Rahul Ravishankar, Zeeshan Patel, Jathushan Rajasegaran

May 25, 2025 ― 6 min read

Computer Vision and Pattern Recognition Addressing Long-Tailed Image Recognition with CP-Mix

CP-Mix improves image recognition for rare classes using confusion pairing methods.

Youngseok Yoon, Sangwoo Hong, Hyungjoon Joo

May 24, 2025 ― 5 min read

Computer Vision and Pattern Recognition Revolutionizing Video Analysis with UniHOI

UniHOI advances the study of human-object interaction in videos.

Chengbo Yuan, Geng Chen, Li Yi

May 24, 2025 ― 5 min read

Machine Learning The Role of the Primate Visual Ventral Stream in Object Recognition

This article explores how the brain identifies objects through the visual ventral stream.

Abdulkadir Gokce, Martin Schrimpf

May 24, 2025 ― 7 min read

Computer Vision and Pattern Recognition Understanding Image Segmentation and Its Applications

Image segmentation helps computers break down images for better recognition.

Ashim Dahal, Saydul Akbar Murad, Nick Rahimi

May 24, 2025 ― 9 min read

Computer Vision and Pattern Recognition Advancements in Visual Piano Transcription Using Transformers

This work transforms piano performances in videos into accurate sheet music.

Uros Zivanovic, Carlos Eduardo Cancino-Chacón

May 24, 2025 ― 7 min read

Artificial Intelligence Understanding Image Classifiers and Their Explanations

Learn how image classifiers work and why their decisions matter.

Hana Chockler, David A. Kelly, Daniel Kroening

May 24, 2025 ― 6 min read

Computer Vision and Pattern Recognition Advancements in Image and Video Processing

New methods improve how machines understand images and text.

Jianing Zhou, Han Li, Shuai Zhang

May 24, 2025 ― 6 min read

Robotics Improving Robot Navigation in Busy Spaces

DG-SLAM helps robots track and map surroundings accurately in chaos.

Yueming Xu, Haochen Jiang, Zhongyang Xiao

May 23, 2025 ― 5 min read

Machine Learning Understanding Adversarial Attacks and Differentiable Rendering

Learn how adversarial attacks manipulate deep learning through differentiable rendering techniques.

Matthew Hull, Chao Zhang, Zsolt Kira

May 23, 2025 ― 6 min read

Computer Vision and Pattern Recognition Advancements in Object Detection with Local-Global Attention

Local-Global Attention enhances object detection by balancing local and global features.

Yifan Shao

May 23, 2025 ― 6 min read

Computer Vision and Pattern Recognition Advancements in Image Segmentation with Trident

Trident combines models to enhance image segmentation and detail recognition.

Yuheng Shi, Minjing Dong, Chang Xu

May 23, 2025 ― 5 min read

Computer Vision and Pattern Recognition Revolutionizing Computer Learning with Prototypical Curriculum

A new teaching method improves image recognition for computers.

Jinhong Lin, Cheng-En Wu, Huanran Li

May 23, 2025 ― 6 min read

Computer Vision and Pattern Recognition Vision Eagle Attention: Redefining Image Focus

A new method improves how computers analyze images by concentrating on key features.

Mahmudul Hasan

May 22, 2025 ― 6 min read

Computer Vision and Pattern Recognition The Oxford Spires Dataset Revealed

A detailed insight into the Oxford Spires Dataset for robotics and computer vision.

Yifu Tao, Miguel Ángel Muñoz-Bañón, Lintong Zhang

May 22, 2025 ― 6 min read

Computer Vision and Pattern Recognition Advancing Scene Understanding with TESGNN

TESGNN enhances machine scene understanding through temporal and spatial data processing.

Quang P. M. Pham, Khoi T. N. Nguyen, Lan C. Ngo

May 22, 2025 ― 7 min read

Computation and Language Enhancing Reasoning in Multimodal Models

A new method improves reasoning skills in language models using preference optimization.

Weiyun Wang, Zhe Chen, Wenhai Wang

May 22, 2025 ― 4 min read

Computer Vision and Pattern Recognition Understanding AI: Filling in the Gaps

A fresh approach to interpreting AI decisions through image gap filling.

Pathirage N. Deelaka, Tharindu Wickremasinghe, Devin Y. De Silva

May 22, 2025 ― 6 min read

Computer Vision and Pattern Recognition Combining Vision and Language for Smarter Object Detection

A new approach merges visual recognition and reasoning for improved image understanding.

Jingru Yang, Huan Yu, Yang Jingxin

May 22, 2025 ― 6 min read

Robotics BEV-ODOM: A Fresh Look at Monocular Visual Odometry

Introducing BEV-ODOM, a simple solution to scale drift in monocular visual odometry.

Yufei Wei, Sha Lu, Fuzhang Han

May 22, 2025 ― 6 min read

Computer Vision and Pattern Recognition Color Morphology and Image Processing Techniques

Exploring advanced methods for color image analysis using mathematical concepts.

Marvin Kahra, Michael Breuß, Andreas Kleefeld

May 22, 2025 ― 5 min read

Computer Vision and Pattern Recognition Improving Image Recognition with Multi-View Learning

A new method to enhance image recognition by combining multiple views.

Jiwoong Yang, Haejun Chung, Ikbeom Jang

May 22, 2025 ― 5 min read