Matthias Gallé

De nouvelles méthodes promettent une meilleure performance des modèles d'IA grâce à un apprentissage par renforcement simplifié.

2025-09-05T04:29:36+00:00 ― 7 min lire

Une nouvelle méthode améliore les modèles de récompense en utilisant des critiques synthétiques pour un meilleur alignement.

2025-08-03T23:12:54+00:00 ― 17 min lire

Examiner l'impact de la contamination des données sur les évaluations de génération de code.

2025-07-15T17:43:24+00:00 ― 8 min lire

Transformez des modèles abandonnés en nouvelles solutions puissantes grâce à la fusion de modèles.

2025-04-10T18:13:30+00:00 ― 8 min lire