Un nuovo metodo migliora l'RL offline usando modelli di diffusione per prendere decisioni migliori.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo metodo migliora l'RL offline usando modelli di diffusione per prendere decisioni migliori.
― 7 leggere min