Jon Ander Campos

Adapt-LLM améliore la performance des LLM en équilibrant les connaissances internes et les infos externes.

2025-08-15T05:07:54+00:00 ― 7 min lire

Une nouvelle méthode améliore les modèles de récompense en utilisant des critiques synthétiques pour un meilleur alignement.

2025-08-03T23:12:54+00:00 ― 17 min lire