Janarthanan Rajendran

Une nouvelle méthode améliore la mémoire pour de meilleures prises de décision chez les agents RL.

2025-08-31T09:48:42+00:00 ― 7 min lire

Un nouvel algorithme améliore l'apprentissage dans des tâches réelles sans réinitialisations.

2025-08-14T13:51:30+00:00 ― 8 min lire

Explorer les attaques par préférence inversée et leur impact sur la sécurité des modèles.

2025-06-09T11:08:36+00:00 ― 7 min lire