Alec Helyar

Une nouvelle méthode améliore l'entraînement de l'IA pour la sécurité et l'utilité.

2025-06-02T01:47:18+00:00 ― 6 min lire

L'alignement délibératif vise à rendre les modèles de langage IA plus sûrs et plus fiables.

2025-02-09T22:33:09+00:00 ― 7 min lire