Lizhou Fan

NPHardEval4V évalue les capacités de raisonnement des modèles de langage multimodaux de grande taille.

2025-09-01T13:19:48+00:00 ― 10 min lire

Un système qui simule des batailles pour révéler les expériences des soldats.

2025-08-17T05:19:18+00:00 ― 8 min lire

Cette étude examine comment les LLM gèrent le raisonnement dans des scénarios abstraits et contextuels.

2025-08-02T16:24:18+00:00 ― 7 min lire

Exploiter les avis en ligne pour améliorer l'accessibilité urbaine pour tous.

2025-06-13T08:37:36+00:00 ― 8 min lire