Sainbayar Sukhbaatar

Une nouvelle source de données améliore les modèles d'apprentissage automatique dans les tâches de raisonnement.

2025-09-26T20:50:24+00:00 ― 9 min lire

Explorer des méthodes pour améliorer les capacités de raisonnement dans les modèles de langue grâce à l'apprentissage par renforcement.

2025-08-31T12:58:18+00:00 ― 7 min lire

Cette étude se concentre sur l'amélioration des réponses des modèles en visant des exigences de longueur spécifiques.

2025-07-24T13:10:48+00:00 ― 7 min lire