Jacob Haimes

Este artigo explora LLMs e seu potencial para comportamentos enganosos no blackjack.

2025-07-21T06:58:12+00:00 ― 5 min ler

Uma olhada nos pontos fortes e fracos do CyberSecEval na segurança de código.

2025-05-24T09:31:30+00:00 ― 8 min ler

Aprenda como o sandbagging afeta as avaliações de IA e maneiras de detectá-lo.

2025-04-25T09:07:00+00:00 ― 7 min ler