Johannes Heidecke

Un nuevo método mejora el entrenamiento de la IA para que sea más segura y útil.

2025-06-02T01:47:18+00:00 ― 5 minilectura

La alineación deliberativa busca hacer que los modelos de lenguaje de IA sean más seguros y confiables.

2025-02-09T22:33:09+00:00 ― 6 minilectura

Descubre cómo el red teaming automatizado mejora la seguridad de la IA a través de desafíos creativos.

2025-01-28T13:37:39+00:00 ― 7 minilectura