Matthias Gallé

Neue Methoden versprechen bessere KI-Modell-Leistungen durch vereinfachtes Reinforcement Learning.

2025-09-05T04:29:36+00:00 ― 6 min Lesedauer

Eine neue Methode verbessert Belohnungsmodelle mit synthetischen Kritiken für eine bessere Abstimmung.

2025-08-03T23:12:54+00:00 ― 13 min Lesedauer

Untersuchung der Auswirkungen von Datenverunreinigungen auf die Bewertungen der Codegenerierung.

2025-07-15T17:43:24+00:00 ― 6 min Lesedauer

Verwandle aussortierte Modelle in kraftvolle neue Lösungen durch Modellfusion.

2025-04-10T18:13:30+00:00 ― 7 min Lesedauer