Untersuchen, wie LLMs lernen und Entscheidungen basierend auf Belohnungen treffen.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Untersuchen, wie LLMs lernen und Entscheidungen basierend auf Belohnungen treffen.
― 6 min Lesedauer
Eine neue Methode hilft dabei, die Kontamination von Testdaten in LLMs anhand von Token-Wahrscheinlichkeiten zu erkennen.
― 9 min Lesedauer