Chris Callison-Burch

Choice-75 teste les modèles de langage sur la prise de décision à travers des scénarios détaillés.

2025-09-24T10:38:36+00:00 ― 9 min lire

Cet article examine des méthodes pour renforcer les niveaux de confiance dans les modèles de langage.

2025-09-05T12:55:12+00:00 ― 8 min lire

FanOutQA aide à évaluer les modèles de langage sur des questions multi-étapes difficiles en utilisant des données structurées.

2025-09-05T08:58:12+00:00 ― 7 min lire

Examiner les limites des modèles linguistiques pour générer des définitions de planification dans des contextes variés.

2025-09-03T00:13:18+00:00 ― 8 min lire

Les modèles de langue améliorent les performances sur le web grâce à des techniques d'auto-amélioration.

2025-08-04T18:10:30+00:00 ― 7 min lire

Améliorer les stratégies de planification dans les jeux et les simulations avec une approche adaptable.

2025-08-04T13:57:42+00:00 ― 7 min lire

Une nouvelle méthode améliore l'alignement et la sécurité des grands modèles de langage.

2025-08-01T14:20:06+00:00 ― 8 min lire

ReDel aide les agents IA à bosser ensemble sur des tâches complexes de manière efficace.

2025-07-02T09:22:42+00:00 ― 8 min lire

Une nouvelle méthode pour améliorer les maîtres de jeu IA en utilisant les appels de fonction dans les jeux de société.

2025-06-14T13:35:36+00:00 ― 7 min lire

Découvrez comment WHAT-IF change les expériences de l'histoire grâce aux choix des joueurs.

2025-03-13T05:41:33+00:00 ― 7 min lire