Ben Athiwaratkun

Scopri come l'attenzione biforcata migliora i modelli linguistici dell'IA per una lavorazione più veloce.

2025-08-29T20:40:54+00:00 ― 6 leggere min

Questo studio migliora la generazione di testo affrontando le sfide dei token incompleti.

2025-08-29T19:37:42+00:00 ― 7 leggere min

Un nuovo modello migliora la comprensione delle immagini, concentrandosi sui dettagli con efficienza.

2025-08-02T19:10:12+00:00 ― 8 leggere min

Un nuovo approccio per valutare le strategie di ragionamento con un occhio ai costi computazionali.

2025-07-31T01:43:54+00:00 ― 7 leggere min

Un nuovo metodo migliora l'efficienza nei modelli di linguaggio di grandi dimensioni usando la sparsità delle attivazioni.

2025-06-22T07:38:18+00:00 ― 4 leggere min

I dataset RedPajama puntano a migliorare l'addestramento dei modelli linguistici attraverso trasparenza e dati di qualità.

2025-05-17T21:13:20+00:00 ― 6 leggere min