Yueqin Yin

Relative Preference Optimization verbessert die Ausrichtung von Sprachmodellen auf die Erwartungen der Nutzer.

2025-09-09T04:12:54+00:00 ― 7 min Lesedauer

Eine neue Methode verbessert Sprachmodelle, indem sie aus Echtzeitdaten lernt.

2025-08-03T22:57:06+00:00 ― 7 min Lesedauer

Eine neue Methode verbessert Text-zu-Bild-Modelle, damit sie besser mit den Vorlieben der Menschen übereinstimmen.

2025-07-30T23:53:18+00:00 ― 8 min Lesedauer