Zhihan Liu

Diese Studie kombiniert grosse Sprachmodelle mit Monte-Carlo-Baum-Suche für bessere Entscheidungen im Spiel.

2025-08-31T06:47:00+00:00 ― 7 min Lesedauer

Eine neue Methode verbessert Sprachmodelle, indem sie aktiv nach vielfältigen Antworten sucht.

2025-08-05T06:41:00+00:00 ― 6 min Lesedauer

Eine Methode zur Minimierung von Überoptimierung in Modellen, die mit menschlichem Feedback trainiert wurden.

2025-07-26T04:46:48+00:00 ― 6 min Lesedauer

Eine neue Methode kombiniert Bayessche Inferenz und maschinelles Lernen für bessere Datenanalyse.

2025-07-11T11:48:36+00:00 ― 6 min Lesedauer

Eine neue Methode verbessert das Training von Sprachmodellen mit selbstgeneriertem Feedback.

2025-06-04T15:08:42+00:00 ― 6 min Lesedauer

Eine neue Methode verbessert Codierungsmodelle mit selbstgenerierten Tests.

2025-05-19T03:37:20+00:00 ― 7 min Lesedauer

Lern, wie Roboter besser werden können, indem sie menschlichen Befehlen folgen und sich an Fehler anpassen.

2025-01-22T09:09:54+00:00 ― 8 min Lesedauer