L'attacco Crescendo usa conversazioni amichevoli per manipolare i modelli AI e farli produrre risultati dannosi.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
L'attacco Crescendo usa conversazioni amichevoli per manipolare i modelli AI e farli produrre risultati dannosi.
― 5 leggere min
La competizione svela vulnerabilità e difese nella sicurezza dei modelli di linguaggio.
― 3 leggere min
Un nuovo modo per dimostrare il possesso di modelli linguistici.
― 5 leggere min
Esaminare le minacce poste dagli agenti autonomi di modelli linguistici e le loro debolezze.
― 7 leggere min