Cosa significa "Ricompensa Esterna"?
Indice
I premi estrinseci sono segnali esterni dati agli agenti in un sistema di apprendimento, spesso sotto forma di punti, voti o punteggi, per incoraggiare certi comportamenti. Aiutano a guidare gli agenti verso il raggiungimento di obiettivi specifici fornendo feedback basato sulle loro azioni. Ad esempio, se un agente completa con successo un compito, può ricevere un premio che riflette questo risultato.
In molte situazioni di apprendimento, soprattutto nei sistemi multi-agente, gli agenti possono condividere lo stesso premio estrinseco per le loro performance. Questo premio condiviso può aiutare a promuovere il lavoro di squadra tra gli agenti, dato che collaborano per raggiungere un obiettivo comune. Tuttavia, questo approccio può a volte portare a tempi di addestramento più lunghi perché tutti gli agenti dipendono dallo stesso segnale.
Per affrontare questa limitazione, alcuni metodi usano premi intrinseci, che sono unici per ogni agente e basati sulle loro azioni individuali. Questo permette agli agenti di ricevere feedback personalizzati, potenzialmente accelerando il processo di apprendimento e migliorando le performance complessive.