Stas Tiomkin

Migliorare l'apprendimento per rinforzo con stime della funzione valore per un adattamento più veloce ai compiti.

2025-07-10T04:56:08+00:00 ― 6 leggere min

Un nuovo metodo migliora come i robot apprendono i compiti usando funzioni di ricompensa basate sugli esponenti di Lyapunov.

2025-05-19T04:02:40+00:00 ― 6 leggere min