Salman Khan

Computer Vision and Pattern Recognition Advancements in Unsupervised Landmark Detection

A new method improves landmark detection without human labeling.

2025-09-24T14:04:00+00:00 ― 5 min read

Computer Vision and Pattern Recognition Advancements in Open-World 3D Instance Segmentation

A new method allows models to recognize both known and unknown objects.

2025-09-22T03:12:42+00:00 ― 7 min read

Computation and Language MobiLlama: A Small Language Model for Everyone

MobiLlama offers efficient language processing for devices with limited resources.

2025-09-04T03:36:30+00:00 ― 5 min read

Computer Vision and Pattern Recognition Evaluating Vision-Based Models Against Background Changes

Understanding model robustness is key for real-world applications in various fields.

2025-08-31T13:53:36+00:00 ― 5 min read

Computer Vision and Pattern Recognition Advances in Video Retrieval with CoVR Method

New framework improves video searches by combining visuals and detailed language descriptions.

2025-08-26T00:23:00+00:00 ― 6 min read

Computer Vision and Pattern Recognition MAVOS: Redefining Video Object Segmentation

MAVOS introduces an efficient method for tracking objects in long video clips.

2025-08-25T14:38:24+00:00 ― 4 min read

Computer Vision and Pattern Recognition Advancements in Remote Sensing Change Detection

ELGC-Net improves accuracy in detecting changes using satellite images.

2025-08-25T13:51:00+00:00 ― 6 min read

Computer Vision and Pattern Recognition Cross-Modal Self-Training: A New Approach

Learn to classify objects using images and 3D point clouds without labels.

2025-08-19T17:21:42+00:00 ― 6 min read

Computer Vision and Pattern Recognition Evaluating the Future of Video-Large Multi-modal Models

Assessing the capabilities and challenges of advanced video understanding models.

2025-08-13T12:42:36+00:00 ― 5 min read

Computer Vision and Pattern Recognition Open-YOLO 3D: A New Method for Fast Object Segmentation

Open-YOLO 3D enhances 3D instance segmentation with speed and accuracy.

2025-08-02T14:25:48+00:00 ― 7 min read

Image and Video Processing Assessing Vulnerabilities in Medical Image Segmentation Models

Study examines the robustness of segmentation models against adversarial attacks in healthcare.

2025-07-30T10:52:35+00:00 ― 6 min read

Computer Vision and Pattern Recognition Advancements in Video Understanding Technology

A new model enhances video comprehension by merging image and video encoders.

2025-07-29T12:28:12+00:00 ― 7 min read

Computer Vision and Pattern Recognition Assessing the Robustness of Visual State Space Models

This article examines how Visual State Space Models handle visual challenges.

2025-07-29T11:48:42+00:00 ― 6 min read

Computer Vision and Pattern Recognition Addressing the Rise of AI-Generated Video Anomalies

VANE-Bench enhances detection of anomalies in videos amidst growing AI content.

2025-07-28T23:41:54+00:00 ― 5 min read

Computer Vision and Pattern Recognition Advancements in Open-Vocabulary Temporal Action Localization

A new method improves video action recognition using contextual language.

2025-07-25T21:50:00+00:00 ― 7 min read

Machine Learning Consistent Proxy Tuning: A New Way for Black-box Models

CPT improves black-box model performance without direct access to internal parameters.

2025-07-21T11:03:06+00:00 ― 6 min read

Computer Vision and Pattern Recognition Advancements in Semantic Segmentation with FANet

FANet enhances semantic segmentation, improving accuracy in complex images.

2025-07-14T13:56:30+00:00 ― 5 min read

Computer Vision and Pattern Recognition Advancements in Computer Vision with GroupMamba

GroupMamba enhances image processing efficiency and accuracy in computer vision tasks.

2025-07-11T05:53:18+00:00 ― 5 min read

Computer Vision and Pattern Recognition Improving Underwater Trash Detection Methods

Effective techniques to detect plastic waste in our oceans.

2025-07-03T05:55:06+00:00 ― 4 min read

Computer Vision and Pattern Recognition Addressing Security Risks in Medical AI Models

New methods expose vulnerabilities in medical models through backdoor attacks.

2025-06-27T20:37:18+00:00 ― 5 min read

Human-Computer Interaction Connecting Dreams and Brain Signals: A New Approach

This study explores innovative ways to influence and interact with dreams through brain signals.

2025-06-27T18:38:48+00:00 ― 7 min read

Machine Learning Advancements in Weather Forecasting for MENA

A study on improving weather predictions in the Middle East and North Africa.

2025-06-10T00:49:39+00:00 ― 5 min read

Computer Vision and Pattern Recognition Advancements in Remote Sensing Change Description

New tools improve how we describe changes in satellite images over time.

2025-06-06T22:03:00+00:00 ― 5 min read

Computer Vision and Pattern Recognition ROAD-Waymo: A New Dataset for Self-Driving Cars

ROAD-Waymo enhances understanding of road actions for autonomous vehicles.

2025-06-01T03:00:36+00:00 ― 6 min read

Computer Vision and Pattern Recognition VideoGLaMM: Connecting Words and Pictures in Videos

VideoGLaMM enhances video understanding through detailed visual and textual connections.

2025-05-28T12:29:15+00:00 ― 7 min read

Computer Vision and Pattern Recognition Understanding GEOBench-VLM: A Benchmark for Vision-Language Models

GEOBench-VLM evaluates models for interpreting geospatial data and images.

2025-05-02T20:38:40+00:00 ― 6 min read

Computer Vision and Pattern Recognition Revolutionizing Healthcare: Meet BiMediX2

A bilingual model transforming medical communication for patients and professionals.

2025-03-26T00:14:51+00:00 ― 7 min read

Computer Vision and Pattern Recognition RHFL+: A New Era for Federated Learning

RHFL+ tackles data noise and model differences in federated learning.

2025-03-17T12:24:45+00:00 ― 6 min read

Computer Vision and Pattern Recognition UniMed: Transforming Medical Imaging with Data

A new dataset revolutionizes analysis of medical images and their descriptions.

2025-03-12T12:50:24+00:00 ― 8 min read

Computer Vision and Pattern Recognition EarthDial: Your Environmental Chat Buddy

Simplifying environmental data through engaging conversations.

2025-02-13T14:49:39+00:00 ― 6 min read