Ahmed Salem

Crescendo attack usa conversa amigável pra manipular modelos de IA e gerar resultados prejudiciais.

2025-08-23T05:14:00+00:00 ― 5 min ler

A competição revela vulnerabilidades e defesas na segurança dos modelos de linguagem.

2025-07-29T17:12:36+00:00 ― 4 min ler

Uma nova abordagem para provar a posse de modelos de linguagem.

2025-07-13T08:42:42+00:00 ― 6 min ler

Analisando as ameaças que os agentes autônomos de modelos de linguagem trazem e suas fraquezas.

2025-07-04T23:55:12+00:00 ― 7 min ler