La ricerca mette in evidenza i metodi per rilevare attacchi backdoor nel fine-tuning dei modelli di linguaggio.
― 9 leggere min
Scienza all'avanguardia spiegata semplicemente
La ricerca mette in evidenza i metodi per rilevare attacchi backdoor nel fine-tuning dei modelli di linguaggio.
― 9 leggere min