Eine Studie zeigt den WordGame-Angriff, der Schwächen in den Sicherheitsmassnahmen von LLM ausnutzt.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Eine Studie zeigt den WordGame-Angriff, der Schwächen in den Sicherheitsmassnahmen von LLM ausnutzt.
― 6 min Lesedauer
Eine neue Methode verbessert das Verständnis von Ausgaben von Sprachmodellen.
― 5 min Lesedauer
Die Selbstkorrekturprozesse in Sprachmodellen und ihre Auswirkungen erkunden.
― 6 min Lesedauer
Neue Methode ermöglicht Hintertürenangriffe ohne saubere Daten oder Modelländerungen.
― 7 min Lesedauer