Hongning Wang

Überprüfung der Genauigkeit von Gesundheitsschnipseln in den Suchergebnissen.

2025-09-13T21:50:36+00:00 ― 6 min Lesedauer

Dieser Artikel stellt eine Methode für Klienten mit unterschiedlichen Zielen im föderierten Banditenlernen vor.

2025-09-03T00:29:06+00:00 ― 7 min Lesedauer

Ein neuer Ansatz zur Belohnung von Über-Optimierung in Sprachmodellen durch Unsicherheitsabschätzung.

2025-08-31T04:16:54+00:00 ― 7 min Lesedauer

ChatGLM-RLHF verbessert die KI-Interaktionen durch menschliches Feedback und fortschrittliche Trainingsmethoden.

2025-08-23T14:27:00+00:00 ― 6 min Lesedauer

GLM-4 Modelle zeigen verbesserte Fähigkeiten im Sprachverständnis und in der Sprachgenerierung.

2025-07-27T06:52:54+00:00 ― 9 min Lesedauer

Eine neue Methode, um zu prüfen, wie gut LLMs Regeln verstehen und anwenden.

2025-06-20T19:41:36+00:00 ― 6 min Lesedauer

Lern, wie menschliches Feedback die Antworten von KI-Sprachmodellen beeinflusst.

2025-04-02T03:58:57+00:00 ― 8 min Lesedauer

Ein neuer Ansatz, um das Befolgen von Anweisungen in Sprachmodellen zu verbessern.

2025-02-28T18:21:36+00:00 ― 6 min Lesedauer