Um método que usa exemplos pra guiar os agentes na tomada de decisão.
― 8 min ler
Ciência de ponta explicada de forma simples
Um método que usa exemplos pra guiar os agentes na tomada de decisão.
― 8 min ler
Explorando como esboços feitos à mão podem melhorar o desempenho das tarefas dos robôs.
― 7 min ler
Uma nova abordagem para treinar modelos de recompensa melhora o alinhamento da IA com as preferências humanas.
― 7 min ler