Jingkuan Song

A new benchmark assesses continual learning in multimodal language models.

2025-08-29T17:23:24+00:00 ― 6 min read

RoScenes offers vital data to improve roadside perception and traffic management.

2025-08-10T12:17:36+00:00 ― 5 min read

A new method enhances the connection between text queries and video content.

2025-08-09T11:24:30+00:00 ― 4 min read

New framework improves training data for language models using images and text.

2025-06-15T02:29:48+00:00 ― 4 min read

Discover how skip tuning enhances efficiency in vision-language models.

2025-02-28T07:07:30+00:00 ― 7 min read