Lizhou Fan

NPHardEval4V assesses reasoning capabilities of multimodal large language models.

2025-09-01T13:19:48+00:00 ― 7 min read

A system that simulates battles to reveal soldiers' experiences.

2025-08-17T05:19:18+00:00 ― 6 min read

This study examines how LLMs handle reasoning in abstract and contextual scenarios.

2025-08-02T16:24:18+00:00 ― 5 min read

Leveraging online reviews to enhance urban accessibility for all.

2025-06-13T08:37:36+00:00 ― 6 min read