Goran Radanović

Desenvolvendo algoritmos pra melhorar o aprendizado por reforço usando feedback humano, mesmo com dados corrompidos.

2025-09-09T15:24:24+00:00 ― 7 min ler

Examinando o impacto da corrupção de dados nas estratégias de aprendizado em jogos de Markov de soma zero para dois jogadores.

2025-09-01T23:36:00+00:00 ― 7 min ler