Arthur Conmy

Este estudio usa autoencoders dispersos para interpretar las salidas de la capa de atención en los transformers.

2025-07-24T13:50:18+00:00 ― 7 minilectura

JumpReLU SAEs mejoran la representación de datos manteniéndolo simple y claro.

2025-07-10T09:44:36+00:00 ― 8 minilectura

Gemma Scope ofrece herramientas para entender mejor los modelos de lenguaje y mejorar la seguridad de la IA.

2025-06-30T01:33:06+00:00 ― 7 minilectura

Un método para mejorar la efectividad del vector de dirección en modelos de lenguaje.

2025-05-31T10:57:27+00:00 ― 5 minilectura