Présentation d'un cadre pour améliorer la prise de décision des agents linguistiques pendant des tâches complexes.
― 7 min lire
La science de pointe expliquée simplement
Présentation d'un cadre pour améliorer la prise de décision des agents linguistiques pendant des tâches complexes.
― 7 min lire
DetectBench évalue les LLMs sur leur capacité à détecter des preuves cachées dans des tâches de raisonnement.
― 7 min lire