Hongning Wang

Examiner la précision des extraits de santé dans les résultats des moteurs de recherche.

2025-09-13T21:50:36+00:00 ― 7 min lire

Cet article présente une méthode pour des clients avec des objectifs variés dans l'apprentissage fédéré de bandits.

2025-09-03T00:29:06+00:00 ― 8 min lire

Une nouvelle approche pour récompenser la sur-optimisation dans les modèles de langage en utilisant l'estimation d'incertitude.

2025-08-31T04:16:54+00:00 ― 9 min lire

ChatGLM-RLHF améliore les interactions avec l'IA grâce à des retours humains et des méthodes d'entraînement avancées.

2025-08-23T14:27:00+00:00 ― 7 min lire

Les modèles GLM-4 montrent de meilleures capacités dans la compréhension et la génération de langage.

2025-07-27T06:52:54+00:00 ― 10 min lire

Une nouvelle méthode pour évaluer à quel point les LLM comprennent et appliquent les règles.

2025-06-20T19:41:36+00:00 ― 8 min lire

Apprends comment les retours humains influencent les réponses des modèles de langage IA.

2025-04-02T03:58:57+00:00 ― 10 min lire

Une nouvelle façon d'améliorer le suivi des instructions dans les modèles de langage.

2025-02-28T18:21:36+00:00 ― 8 min lire