Xianyuan Zhan

OMIGA melhora o aprendizado offline de múltiplos agentes ao integrar estratégias de aprendizado globais e locais.

2025-10-17T05:43:06+00:00 ― 7 min ler

O FISOR melhora a segurança no aprendizado de reforço offline com regras rígidas e métodos de aprendizado únicos.

2025-09-15T20:43:00+00:00 ― 8 min ler

Uma nova abordagem melhora o desempenho do aprendizado por reforço offline através de atualizações de gradiente ortogonal.

2025-09-12T09:46:00+00:00 ― 9 min ler

Novo framework melhora a maneira como os robôs aprendem com visuais e linguagem.

2025-09-03T04:18:12+00:00 ― 8 min ler

Um novo método pra melhorar o seguimento de instruções de imagem em modelos multimodais.

2025-08-04T13:49:48+00:00 ― 6 min ler

Um novo método melhora o RL offline usando modelos de difusão pra tomar decisões melhores.

2025-07-05T14:32:06+00:00 ― 8 min ler