Tianqi Liu

Une nouvelle méthode améliore l'alignement de l'IA en utilisant des retours en temps réel.

2025-09-10T04:02:48+00:00 ― 7 min lire

La recherche vise à rendre les modèles de langage plus sûrs et plus utiles pour les utilisateurs.

2025-08-21T06:36:48+00:00 ― 8 min lire

Nouvelle technique CCSO qui améliore l'efficacité du codage vidéo et la qualité visuelle.

2025-08-01T22:47:45+00:00 ― 8 min lire

Une nouvelle étude examine comment les environnements intérieurs influencent le confort et le bien-être personnel.

2025-07-04T02:03:48+00:00 ― 7 min lire

LAMPO améliore la classification ordinale en utilisant des modèles de langage larges pour une meilleure comparaison d'articles.

2025-07-01T13:37:42+00:00 ― 6 min lire

Une nouvelle approche pour entraîner des modèles de récompense améliore l'alignement de l'IA avec les préférences humaines.

2025-06-09T16:00:54+00:00 ― 9 min lire

Cette méthode aide les IA à apprendre en créant et en résolvant des défis.

2025-05-26T00:12:48+00:00 ― 8 min lire