Nishanth Dikkala

Un nouveau jeu de données évalue comment les LLM raisonnent avec plusieurs images.

2025-07-29T07:35:54+00:00 ― 7 min lire

Les modèles de langage causaux montrent du potentiel pour résoudre les puzzles de Sudoku et de Zebra.

2025-06-11T10:24:42+00:00 ― 5 min lire

Michel-Ange évalue les modèles de langage sur leur capacité à raisonner à travers de longs contextes.

2025-06-09T07:51:06+00:00 ― 5 min lire