Wenkai Yang

Questo articolo esamina la minaccia degli attacchi backdoor sugli agenti dei modelli linguistici.

2025-09-07T01:39:18+00:00 ― 5 leggere min

La ricerca rivela rischi di sicurezza significativi nei modelli di chat a causa di attacchi backdoor.

2025-08-23T12:52:12+00:00 ― 7 leggere min

Esplora le sfide di supervisionare modelli di intelligenza artificiale avanzati con controparti più deboli.

2025-07-27T15:26:24+00:00 ― 7 leggere min