Rishabh Joshi

La recherche vise à rendre les modèles de langage plus sûrs et plus utiles pour les utilisateurs.

2025-08-21T06:36:48+00:00 ― 8 min lire

Une nouvelle approche pour entraîner des modèles de récompense améliore l'alignement de l'IA avec les préférences humaines.

2025-06-09T16:00:54+00:00 ― 9 min lire

Cette méthode aide les IA à apprendre en créant et en résolvant des défis.

2025-05-26T00:12:48+00:00 ― 8 min lire