Qingqing Ye

Neues Modell passt sich an die sich entwickelnden Datenvergiftungsbedrohungen an, indem es interaktive Spieltheorie-Strategien nutzt.

2025-08-29T00:32:12+00:00 ― 8 min Lesedauer

Ein Blick auf die Risiken von Prompt-Leaks in grossen Sprachmodellen und Methoden zur Vermeidung.

2025-07-01T23:38:06+00:00 ― 6 min Lesedauer

LoRD verbessert die Effizienz bei Modellausbruchsangriffen auf grosse Sprachmodelle.

2025-06-17T05:03:24+00:00 ― 6 min Lesedauer