Tuo Zhao

Cette étude met en lumière la complexité d'échantillonnage des algorithmes de descente de miroir de politique neuronale en apprentissage profond.

2025-09-18T18:51:28+00:00 ― 6 min lire

Découvre une méthode d'optimisation décentralisée qui protège les données des utilisateurs tout en améliorant l'efficacité.

2025-08-06T22:52:45+00:00 ― 7 min lire

Une nouvelle méthode pour améliorer l'alignement de l'IA avec les valeurs humaines en utilisant des retours corrompus.

2025-07-25T21:57:54+00:00 ― 6 min lire

Une nouvelle méthode améliore la manière dont les modèles de langage suivent des instructions complexes.

2025-06-14T16:29:24+00:00 ― 6 min lire