Arthur Conmy

Questo studio usa autoencoder sparsi per interpretare i risultati degli strati di attenzione nei transformer.

2025-07-24T13:50:18+00:00 ― 6 leggere min

I JumpReLU SAEs migliorano la rappresentazione dei dati mantenendola semplice e chiara.

2025-07-10T09:44:36+00:00 ― 7 leggere min

Gemma Scope offre strumenti per capire meglio i modelli di linguaggio e migliorare la sicurezza dell'IA.

2025-06-30T01:33:06+00:00 ― 6 leggere min

Un metodo per migliorare l'efficacia dei vettori di steering nei modelli linguistici.

2025-05-31T10:57:27+00:00 ― 5 leggere min