Deming Chen

Un nuovo metodo accelera la generazione di testo dagli LLM usando teste di previsione aggiuntive.

2025-09-15T18:05:00+00:00 ― 4 leggere min

Un nuovo approccio migliora l'apprendimento federato affrontando efficacemente i client lenti.

2025-09-13T01:18:12+00:00 ― 9 leggere min

Un nuovo metodo riduce la dimensione della cache KV mantenendo alte le prestazioni del modello.

2025-08-17T07:17:48+00:00 ― 6 leggere min

Questo articolo parla degli sviluppi recenti per migliorare l'efficienza nei Modelli di Linguaggio Generale.

2025-07-28T05:08:00+00:00 ― 6 leggere min