Rafael Rafailov

MOTO melhora o aprendizado de robôs juntando treinamento offline com ajustes online.

2025-09-18T17:26:48+00:00 ― 7 min ler

Este estudo avalia métodos para melhorar modelos de linguagem grande usando dados de preferência dos usuários.

2025-08-17T07:09:54+00:00 ― 6 min ler

Analisando a superotimização em DAAs e seu impacto no desempenho do modelo.

2025-08-02T17:35:24+00:00 ― 9 min ler

Um novo modelo permite que robôs aprendam tarefas melhor usando entradas visuais e de linguagem.

2025-07-29T08:31:12+00:00 ― 8 min ler

Um novo método pra avaliar os valores diversos dos usuários em modelos de linguagem.

2025-07-07T16:18:18+00:00 ― 9 min ler