Pengcheng He

Évaluer la capacité des LLM à détecter des instructions nuisibles dans les demandes des utilisateurs.

2025-10-07T17:56:06+00:00 ― 7 min lire

HERON simplifie la conception des récompenses, améliorant l'efficacité et la flexibilité de l'apprentissage par renforcement.

2025-09-30T13:50:48+00:00 ― 8 min lire

Une nouvelle méthode améliore l'efficacité des modèles de langage sans sacrifier la qualité.

2025-08-13T02:02:42+00:00 ― 7 min lire