Han Zhong

Une nouvelle approche pour améliorer l'apprentissage dans les MDP à récompense moyenne à horizon infini.

2025-08-09T05:03:40+00:00 ― 13 min lire

Une nouvelle méthode améliore les modèles de langage en cherchant activement des réponses diverses.

2025-08-05T06:41:00+00:00 ― 8 min lire

Découvre les aimants 2D et leur potentiel dans la technologie.

2025-07-20T18:32:42+00:00 ― 7 min lire