Jacob Haimes

Este artículo explora los LLMs y su potencial para comportamientos engañosos en el blackjack.

2025-07-21T06:58:12+00:00 ― 5 minilectura

Una mirada a las fortalezas y debilidades de CyberSecEval en la seguridad del código.

2025-05-24T09:31:30+00:00 ― 8 minilectura

Aprende cómo el sandbagging afecta las evaluaciones de IA y maneras de detectarlo.

2025-04-25T09:07:00+00:00 ― 7 minilectura