Janarthanan Rajendran

Un nuovo metodo migliora la memoria per prendere decisioni migliori negli agenti RL.

2025-08-31T09:48:42+00:00 ― 6 leggere min

Nuovo algoritmo migliora l'apprendimento in compiti del mondo reale senza ripristini.

2025-08-14T13:51:30+00:00 ― 6 leggere min

Esplorando gli attacchi di preferenza inversa e il loro impatto sulla sicurezza dei modelli.

2025-06-09T11:08:36+00:00 ― 5 leggere min