Diese Studie befasst sich mit den Herausforderungen beim Bearbeiten von Sprachmodellen und der Minderung unerwünschter Nebeneffekte.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Diese Studie befasst sich mit den Herausforderungen beim Bearbeiten von Sprachmodellen und der Minderung unerwünschter Nebeneffekte.
― 6 min Lesedauer
VCEval bietet eine automatisierte Möglichkeit, die Effektivität von Online-Kursen zu bewerten.
― 5 min Lesedauer
DetectBench bewertet LLMs danach, wie gut sie versteckte Hinweise in Denksportaufgaben erkennen können.
― 6 min Lesedauer