Elizabeth Daly

Eine neue Methode, um Belohnungssysteme im Reinforcement Learning mithilfe von Nutzerfeedback zu verfeinern.

2025-10-02T12:11:36+00:00 ― 9 min Lesedauer

Eine neuartige Methode vorstellen, um Sprachmodelle zu bewerten, ohne dass man Referenzantworten braucht.

2025-09-05T20:25:30+00:00 ― 11 min Lesedauer