AdaPPA aprimora ataques de jailbreak em modelos de linguagem combinando respostas seguras e prejudiciais.
― 5 min ler
Ciência de ponta explicada de forma simples
AdaPPA aprimora ataques de jailbreak em modelos de linguagem combinando respostas seguras e prejudiciais.
― 5 min ler