Wenyue Hua

This article examines the difficulties and techniques in updating knowledge in language models.

2025-09-08T11:01:40+00:00 ― 4 min read

NPHardEval4V assesses reasoning capabilities of multimodal large language models.

2025-09-01T13:19:48+00:00 ― 7 min read

A system that simulates battles to reveal soldiers' experiences.

2025-08-17T05:19:18+00:00 ― 6 min read

This study examines how LLMs handle reasoning in abstract and contextual scenarios.

2025-08-02T16:24:18+00:00 ― 5 min read

This article explores how adversaries impact teamwork among language models.

2025-07-26T11:00:00+00:00 ― 12 min read

Discover how StockAgent uses AI to simulate stock trading and analyze market behavior.

2025-07-14T12:49:39+00:00 ― 6 min read