Crescendo attack usa conversa amigável pra manipular modelos de IA e gerar resultados prejudiciais.
― 5 min ler
Ciência de ponta explicada de forma simples
Crescendo attack usa conversa amigável pra manipular modelos de IA e gerar resultados prejudiciais.
― 5 min ler
A competição revela vulnerabilidades e defesas na segurança dos modelos de linguagem.
― 4 min ler
Uma nova abordagem para provar a posse de modelos de linguagem.
― 6 min ler
Analisando as ameaças que os agentes autônomos de modelos de linguagem trazem e suas fraquezas.
― 7 min ler