Simple Science

Scienza all'avanguardia spiegata semplicemente

Scienza all'avanguardia spiegata semplicemente

Tianrong Zhang

Apprendimento automatico Nuova strategia d'attacco mette a rischio la sicurezza degli LLM

Uno studio rivela l'attacco WordGame, che sfrutta le debolezze nelle misure di sicurezza degli LLM.

2025-08-09T04:17:54+00:00 ― 6 leggere min

Calcolo e linguaggio Affrontare gli attacchi backdoor nei modelli di NLP

Nuovi metodi come PromptFix aiutano a proteggere i modelli di linguaggio da minacce nascoste.

2025-08-01T15:47:00+00:00 ― 5 leggere min