Jiafei Lyu

SEABO genera ricompense da dati esperti, semplificando l'apprendimento per imitazione offline.

2025-09-10T14:58:30+00:00 ― 6 leggere min

Questo documento parla delle sfide e delle soluzioni nelle prestazioni dell'apprendimento per rinforzo visivo.

2025-09-05T23:46:56+00:00 ― 8 leggere min

Nuovo metodo migliora l'adattabilità dell'IA in diversi ambienti.

2025-08-07T12:55:48+00:00 ― 7 leggere min

DLLM combina il reinforcement learning con i modelli linguistici per migliorare le prestazioni nei compiti.

2025-07-30T11:46:30+00:00 ― 6 leggere min

SUMO migliora la presa di decisioni nell'apprendimento per rinforzo offline aumentando la stima dell'incertezza.

2025-06-23T02:28:00+00:00 ― 6 leggere min