Baolin Peng

Bewertung der Fähigkeit von LLMs, schädliche Anweisungen in Benutzeraufforderungen zu erkennen.

2025-10-07T17:56:06+00:00 ― 6 min Lesedauer

Neue Methoden verbessern die Ausrichtung von Sprachmodellen an menschlichen Werten.

2025-09-25T08:22:06+00:00 ― 6 min Lesedauer

Untersuchung des Einflusses der Konsistenz von Belohnungsmodellen auf die Leistung von Sprachmodellen.

2025-09-20T10:07:54+00:00 ― 6 min Lesedauer

Eine Methode, um die Genauigkeit in grossen Sprachmodellen zu verbessern und gleichzeitig abwechslungsreiche Antworten zu gewährleisten.

2025-09-03T19:26:42+00:00 ― 7 min Lesedauer

Ein Framework, das Selbstbewertung und Suchmethoden kombiniert, um die Leistung von Sprachmodellen zu verbessern.

2025-08-18T10:56:48+00:00 ― 7 min Lesedauer

Eine neue Methode verbessert die Leistung von LLMs bei komplexen Mathematikaufgaben.

2025-07-22T09:10:18+00:00 ― 5 min Lesedauer

Forscher verbessern grosse Sprachmodelle durch Selbstverbesserung mit codebasierten Methoden.

2025-06-20T15:36:42+00:00 ― 8 min Lesedauer