Adish Singla

Développer des algos pour améliorer l'apprentissage par renforcement en utilisant les retours humains malgré la corruption des données.

2025-09-09T15:24:24+00:00 ― 7 min lire

Examen de l'impact de la corruption des données sur les stratégies d'apprentissage dans des jeux de Markov à somme nulle à deux joueurs.

2025-09-01T23:36:00+00:00 ― 8 min lire

L'étude combine des technologies RL et LLM pour améliorer les performances des agents éducatifs.

2025-08-15T15:00:24+00:00 ― 9 min lire

Découvre comment des indices peuvent améliorer tes compétences en programmation et la résolution de bugs.

2025-03-04T14:38:51+00:00 ― 6 min lire