Andi Nika

Sviluppare algoritmi per migliorare il reinforcement learning usando il feedback umano nonostante la corruzione dei dati.

2025-09-09T15:24:24+00:00 ― 6 leggere min

Esaminando l'impatto della corruzione dei dati sulle strategie di apprendimento nei giochi di Markov a somma zero per due giocatori.

2025-09-01T23:36:00+00:00 ― 6 leggere min