Ein Rahmen zur Bewertung der Interaktionen zwischen Menschen und automatisierten Systemen, um Sicherheit und Effizienz zu verbessern.
― 5 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein Rahmen zur Bewertung der Interaktionen zwischen Menschen und automatisierten Systemen, um Sicherheit und Effizienz zu verbessern.
― 5 min Lesedauer
Wir testen die Denkfähigkeiten von Sprachmodellen mit verschiedenen Spielen und stellen dabei erhebliche Einschränkungen fest.
― 8 min Lesedauer