Siheng Zhao

Um novo método automatiza funções de recompensa densas usando grandes modelos de linguagem.

2025-09-24T09:27:30+00:00 ― 9 min ler

Um sistema chamado TieBot ajuda robôs a aprenderem a dar nó em gravatas usando simulações.

2025-07-23T09:38:40+00:00 ― 9 min ler

Transformando o treinamento de robôs com movimentos parecidos com os humanos capturados em vídeo.

2025-02-19T16:52:57+00:00 ― 8 min ler