Simple Science

Scienza all'avanguardia spiegata semplicemente

Scienza all'avanguardia spiegata semplicemente

Xinyue Shen

Crittografia e sicurezza Attacchi di Jailbreak sui Modelli Linguistici: una Minaccia Crescente

L'esame degli attacchi di jailbreak mostra debolezze nella sicurezza dei modelli linguistici.

2025-09-09T19:37:12+00:00 ― 5 leggere min

Crittografia e sicurezza Valutando i classificatori di sicurezza delle immagini con UnsafeBench

Un nuovo framework valuta l'efficacia dei classificatori di sicurezza delle immagini contro contenuti nocivi.

2025-08-13T09:48:48+00:00 ― 11 leggere min