Ahmed Salem

L'attacco Crescendo usa conversazioni amichevoli per manipolare i modelli AI e farli produrre risultati dannosi.

2025-08-23T05:14:00+00:00 ― 5 leggere min

La competizione svela vulnerabilità e difese nella sicurezza dei modelli di linguaggio.

2025-07-29T17:12:36+00:00 ― 3 leggere min

Un nuovo modo per dimostrare il possesso di modelli linguistici.

2025-07-13T08:42:42+00:00 ― 5 leggere min

Esaminare le minacce poste dagli agenti autonomi di modelli linguistici e le loro debolezze.

2025-07-04T23:55:12+00:00 ― 7 leggere min