ALERT-Benchmark bewertet Sicherheitsrisiken in Sprachmodellen, um deren Antworten zu verbessern.
― 4 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
ALERT-Benchmark bewertet Sicherheitsrisiken in Sprachmodellen, um deren Antworten zu verbessern.
― 4 min Lesedauer
M-ALERT testet Sprachmodelle auf Sicherheit in fünf Sprachen.
― 6 min Lesedauer