Asa Cooper Stickland

Un aperçu de la façon de contrôler le comportement des modèles de langage avec la technique KL-then-steer.

2025-07-26T13:30:06+00:00 ― 7 min lire

Cet article examine les vulnérabilités des modèles d'IA liées aux événements futurs.

2025-07-19T13:53:24+00:00 ― 8 min lire

Une méthode pour améliorer le comportement des modèles de langage contre les sorties nuisibles.

2025-07-08T20:36:48+00:00 ― 8 min lire