Simple Science

La science de pointe expliquée simplement

Derniers articles pour Apprentissage automatique

Apprentissage automatiquePrésentation de TSO : Une nouvelle façon d'aligner les LLM avec les préférences humaines

TSO améliore les modèles de langue en mettant l'accent sur la diversité, la validité et l'adaptabilité des données de préférence.

Kaihui Chen, Hao Yi, Qingyang Li

― 10 min lire