Bill Byrne

Eine neue Methode verbessert die Trainingsgeschwindigkeit und reduziert den Speicherbedarf für Sprachmodelle.

2025-08-29T03:41:48+00:00 ― 7 min Lesedauer

Wir verbessern die Direkte Präferenzoptimierung, um besser mit Unentschieden bei Entscheidungen umzugehen.

2025-06-06T05:51:18+00:00 ― 7 min Lesedauer