Arthur Conmy

Esse estudo usa autoencoders esparsos pra interpretar as saídas da camada de atenção em transformers.

2025-07-24T13:50:18+00:00 ― 7 min ler

JumpReLU SAEs melhoram a representação dos dados mantendo tudo simples e claro.

2025-07-10T09:44:36+00:00 ― 8 min ler

Gemma Scope oferece ferramentas pra entender melhor os modelos de linguagem e melhorar a segurança da IA.

2025-06-30T01:33:06+00:00 ― 7 min ler

Um método pra melhorar a eficácia do vetor de direcionamento em modelos de linguagem.

2025-05-31T10:57:27+00:00 ― 5 min ler