Modelos de IA: FingindoModelos de IA: FingindoSegurança ou Alinhados?enganoso da IA revelados.Métodos pra detectar comportamentoComputação e linguagemDetectando Falsificadores de Alinhamento em Modelos de IAUm benchmark pra identificar modelos de IA que tão fingindo ser seguros.2025-08-12T19:11:54+00:00 ― 7 min ler