Um novo algoritmo de aprendizado pra agentes em cenários multi-jogador restritos.
― 6 min ler
Ciência de ponta explicada de forma simples
Um novo algoritmo de aprendizado pra agentes em cenários multi-jogador restritos.
― 6 min ler
Uma nova classe de PMD melhora o aprendizado por reforço através da tomada de decisão em múltiplas etapas.
― 5 min ler
Novos algoritmos de aprendizado melhoram as interações dos agentes em ambientes compartilhados.
― 7 min ler