Hier ist TABDet, eine neue Methode zur Erkennung von Backdoor-Angriffen in NLP-Aufgaben.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Hier ist TABDet, eine neue Methode zur Erkennung von Backdoor-Angriffen in NLP-Aufgaben.
― 6 min Lesedauer
Überprüfung von Datenschutzbedenken und Lösungen für grosse Sprachmodelle in Textdaten.
― 4 min Lesedauer
Untersuchung von Schwachstellen in klinischen Sprachmodellen und deren Auswirkungen auf die Patientensicherheit.
― 7 min Lesedauer
TrojVLM zeigt Schwachstellen in Vision Language Models für Backdoor-Angriffe auf.
― 8 min Lesedauer