Shangtong Zhang

Ce document examine l'utilisation de l'apprentissage TD dans les transformateurs pour l'apprentissage en contexte.

2025-08-09T00:44:36+00:00 ― 9 min lire

Nouvelles découvertes sur la convergence en apprentissage TD linéaire sans indépendance stricte des caractéristiques.

2025-06-10T02:17:06+00:00 ― 7 min lire

De nouvelles idées sur l'apprentissage TD avec récompense moyenne aident à garantir des prises de décision fiables.

2025-05-27T10:38:38+00:00 ― 8 min lire

Un nouveau cadre vise à améliorer la sécurité dans les véhicules autonomes grâce à des simulations ciblées.

2025-05-09T17:44:00+00:00 ― 10 min lire