A pesquisa destaca métodos para detectar ataques de backdoor em ajustes de modelos de linguagem.
― 10 min ler
Ciência de ponta explicada de forma simples
A pesquisa destaca métodos para detectar ataques de backdoor em ajustes de modelos de linguagem.
― 10 min ler