Liyuan Mao

Uma nova abordagem melhora o desempenho do aprendizado por reforço offline através de atualizações de gradiente ortogonal.

2025-09-12T09:46:00+00:00 ― 9 min ler

Novo framework melhora a maneira como os robôs aprendem com visuais e linguagem.

2025-09-03T04:18:12+00:00 ― 8 min ler

Um novo método melhora o RL offline usando modelos de difusão pra tomar decisões melhores.

2025-07-05T14:32:06+00:00 ― 8 min ler