Kaijie Zhu

Une nouvelle méthode équilibre la robustesse du modèle et la généralisation face à des entrées difficiles.

2025-10-13T16:16:00+00:00 ― 6 min lire

On te présente une nouvelle approche pour évaluer efficacement les gros modèles de langage.

2025-09-05T09:14:00+00:00 ― 8 min lire

NPHardEval4V évalue les capacités de raisonnement des modèles de langage multimodaux de grande taille.

2025-09-01T13:19:48+00:00 ― 10 min lire

Cette étude examine comment les LLM gèrent le raisonnement dans des scénarios abstraits et contextuels.

2025-08-02T16:24:18+00:00 ― 7 min lire

Examiner les problèmes et les améliorations potentielles dans l'évaluation par les pairs académique.

2025-07-27T05:49:42+00:00 ― 10 min lire