Un nuevo método mejora el entrenamiento de la IA para que sea más segura y útil.
― 5 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo método mejora el entrenamiento de la IA para que sea más segura y útil.
― 5 minilectura
La alineación deliberativa busca hacer que los modelos de lenguaje de IA sean más seguros y confiables.
― 6 minilectura
Descubre cómo el red teaming automatizado mejora la seguridad de la IA a través de desafíos creativos.
― 7 minilectura