Hongyuan Mei

Les tests de benchmark MANGO évaluent les modèles de langage pour la navigation et la cartographie dans des contextes de labyrinthe.

2025-08-24T20:28:12+00:00 ― 8 min lire

Cet article explore comment les LLM génèrent et affinent des hypothèses scientifiques à partir des données existantes.

2025-08-22T06:43:06+00:00 ― 10 min lire