Uma ferramenta pra avaliar a segurança de modelos de linguagem avançados.
― 6 min ler
Ciência de ponta explicada de forma simples
Uma ferramenta pra avaliar a segurança de modelos de linguagem avançados.
― 6 min ler
Novo método MEOW enfrenta a tarefa de desaprender dados sensíveis em LLMs sem perder desempenho.
― 6 min ler