Qi Wu

Computer Vision and Pattern Recognition Advancing Drone Navigation with AerialVLN

AerialVLN improves drone navigation using language and visual data.

2025-10-09T05:52:48+00:00 ― 5 min read

Computer Vision and Pattern Recognition Introducing ClipVID: A New Approach to Video Object Detection

ClipVID improves object detection by focusing on unique identities across frames.

2025-10-08T09:20:24+00:00 ― 5 min read

Computer Vision and Pattern Recognition Streamlining Text-Video Retrieval with Prompt Cube

A simplified method improves efficiency in text-video matching.

2025-10-08T08:25:06+00:00 ― 5 min read

Computer Vision and Pattern Recognition New Evaluation Method for Text-to-Image Synthesis

A novel approach to assess image generation quality based on text descriptions.

2025-10-08T01:26:24+00:00 ― 7 min read

Machine Learning A New Approach to Irregular Time Series Data

Introducing a framework for better analysis of irregularly sampled time series data.

2025-10-04T04:13:12+00:00 ― 8 min read

Computer Vision and Pattern Recognition Bridging Text and Visuals: The Future of Language Models

A new technique helps language models generate diverse outputs beyond text.

2025-09-26T17:32:54+00:00 ― 6 min read

Computer Vision and Pattern Recognition Strengthening Vision Transformers Against Attacks

A new method enhances security of Vision Transformers against adversarial attacks.

2025-09-19T10:18:00+00:00 ― 6 min read

Computer Vision and Pattern Recognition Introducing ModaVerse: A New Multi-Modal Model

ModaVerse simplifies how we transform and interpret various types of data.

2025-09-17T09:11:18+00:00 ― 6 min read

Computer Vision and Pattern Recognition NaVid: A New Approach to Robot Navigation

NaVid helps robots follow human instructions using video, improving real-world navigation.

2025-09-04T11:46:18+00:00 ― 5 min read

Machine Learning Understanding Conditional Average Treatment Effect Estimation

A new method improves CATE estimation and enhances decision-making in various fields.

2025-08-25T12:24:56+00:00 ― 7 min read

Computer Vision and Pattern Recognition Advancements in Single Image View Synthesis

G-NeRF innovates generating new views from single images with enhanced geometry techniques.

2025-08-20T08:22:18+00:00 ― 6 min read

Computer Vision and Pattern Recognition Introducing MotionLLM: Bridging Language and Human Motion

MotionLLM creates human movements from text for single and multi-person scenarios.

2025-08-06T06:46:42+00:00 ― 5 min read

Graphics Advancements in Rendering with Data-Parallel ANARI

Data-parallel ANARI improves rendering efficiency and quality in scientific visualization.

2025-07-23T00:50:24+00:00 ― 8 min read

Computation and Language Navigating the Future: Vision-and-Language Systems

Exploring how machines can follow human directions in real-world spaces.

2025-07-16T17:17:30+00:00 ― 6 min read

Computer Vision and Pattern Recognition Advancing Robot Navigation with Language Models

Combining language understanding and vision enhances robot navigation capabilities.

2025-07-11T12:28:18+00:00 ― 6 min read

Computer Vision and Pattern Recognition Improving Medical Diagnosis with XLIP Framework

XLIP enhances diagnosis by integrating medical images and text descriptions.

2025-07-05T22:57:42+00:00 ― 6 min read

High Energy Physics - Phenomenology Unraveling the Mysteries of Charmonium States

This article delves into the intriguing properties and production mechanisms of charmonium states.

2025-06-10T22:56:18+00:00 ― 5 min read

Cryptography and Security Navigating the Challenges of Multimodal Foundation Models

This article discusses the safety and security issues in multimodal AI systems.

2025-05-21T07:21:27+00:00 ― 6 min read

Epidemiology Legionella Pneumophila: A Serious Health Threat

Learn about Legionella pneumonia, its risks, symptoms, and importance of early treatment.

2025-05-21T03:01:12+00:00 ― 6 min read

Cryptography and Security Keeping Creativity Safe in the Age of Diffusion Models

Learn how new watermarking techniques protect digital art and creative ideas.

2025-05-20T02:25:20+00:00 ― 6 min read

Computer Vision and Pattern Recognition Evaluating Multimodal Large Language Models with AbilityLens

AbilityLens standardizes evaluation for multimodal large language models.

2025-05-15T13:54:40+00:00 ― 6 min read

Computer Vision and Pattern Recognition Revolutionizing Scientific Analysis with Hypernetworks

Hypernetworks transform data analysis, filling gaps and improving precision in dynamic simulations.

2025-04-10T14:12:45+00:00 ― 7 min read

Computer Vision and Pattern Recognition Machines Learning to Navigate with Language

Research focuses on teaching machines to follow spoken and written navigation instructions.

2025-04-03T13:41:15+00:00 ― 6 min read

Graphics Transforming Computer Graphics with 3D Gaussian Splatting

A new way to render stunning visuals in real time.

2025-03-05T01:04:48+00:00 ― 6 min read