Sicun Gao

Explorer les méthodes de gradient de politique et leurs effets sur la prise de décision dans l'apprentissage par renforcement.

2025-08-05T12:36:30+00:00 ― 6 min lire

Combiner la reachabilité Hamilton-Jacobi avec l'apprentissage par renforcement améliore la sécurité dans les systèmes de contrôle.

2025-07-17T12:45:10+00:00 ― 5 min lire