Jacob Haimes

Cet article explore les LLM et leur potentiel pour des comportements trompeurs au blackjack.

2025-07-21T06:58:12+00:00 ― 6 min lire

Un aperçu des forces et faiblesses de CyberSecEval en matière de sécurité du code.

2025-05-24T09:31:30+00:00 ― 8 min lire

Apprends comment le sandbagging influence les évaluations de l'IA et des astuces pour le détecter.

2025-04-25T09:07:00+00:00 ― 7 min lire