Um novo método automatiza funções de recompensa densas usando grandes modelos de linguagem.
― 9 min ler
Ciência de ponta explicada de forma simples
Um novo método automatiza funções de recompensa densas usando grandes modelos de linguagem.
― 9 min ler
Um sistema chamado TieBot ajuda robôs a aprenderem a dar nó em gravatas usando simulações.
― 9 min ler
Transformando o treinamento de robôs com movimentos parecidos com os humanos capturados em vídeo.
― 8 min ler