Un marco para evaluar las interacciones entre personas y sistemas automatizados para mejorar la seguridad y la eficiencia.
― 6 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un marco para evaluar las interacciones entre personas y sistemas automatizados para mejorar la seguridad y la eficiencia.
― 6 minilectura
Probamos las habilidades de razonamiento de los modelos de lenguaje usando varios juegos, revelando limitaciones significativas.
― 10 minilectura