Yule Liu

Esamina vari attacchi di jailbreak sui modelli di linguaggio e le loro difese.

2025-07-18T11:09:42+00:00 ― 7 leggere min

La ricerca mette in evidenza i metodi per rilevare attacchi backdoor nel fine-tuning dei modelli di linguaggio.

2025-05-06T10:46:40+00:00 ― 9 leggere min

Metodi innovativi puntano a migliorare i modelli linguistici dell'IA, garantendo al contempo sicurezza ed efficienza.

2025-04-30T12:54:40+00:00 ― 6 leggere min