Stas Tiomkin

Melhorando o aprendizado por reforço com estimativas da função de valor pra uma adaptação mais rápida às tarefas.

2025-07-10T04:56:08+00:00 ― 7 min ler

Um novo método melhora como os robôs aprendem tarefas usando funções de recompensa baseadas em expoentes de Lyapunov.

2025-05-19T04:02:40+00:00 ― 7 min ler