NPHardEval4V évalue les capacités de raisonnement des modèles de langage multimodaux de grande taille.
― 10 min lire
La science de pointe expliquée simplement
NPHardEval4V évalue les capacités de raisonnement des modèles de langage multimodaux de grande taille.
― 10 min lire
Un système qui simule des batailles pour révéler les expériences des soldats.
― 8 min lire
Cette étude examine comment les LLM gèrent le raisonnement dans des scénarios abstraits et contextuels.
― 7 min lire
Exploiter les avis en ligne pour améliorer l'accessibilité urbaine pour tous.
― 8 min lire