Bochuan Cao

Eine Studie zeigt den WordGame-Angriff, der Schwächen in den Sicherheitsmassnahmen von LLM ausnutzt.

2025-08-09T04:17:54+00:00 ― 6 min Lesedauer

Eine neue Methode verbessert das Verständnis von Ausgaben von Sprachmodellen.

2025-08-04T08:02:12+00:00 ― 5 min Lesedauer

Die Selbstkorrekturprozesse in Sprachmodellen und ihre Auswirkungen erkunden.

2025-08-02T12:27:18+00:00 ― 6 min Lesedauer

Neue Methode ermöglicht Hintertürenangriffe ohne saubere Daten oder Modelländerungen.

2025-03-27T16:22:21+00:00 ― 7 min Lesedauer