Yingyan Celine Lin

Forschung zur Verbesserung der Effizienz von Sprachmodellen mit linearer Aufmerksamkeit und spekulativem Decoding.

2025-07-30T11:38:36+00:00 ― 7 min Lesedauer

Erforschen, wie Aufmerksamkeitssenkungen die Leistung von Sprachmodellen beeinflussen und eine Kalibrierungstechnik vorstellen.

2025-07-25T11:02:12+00:00 ― 6 min Lesedauer

Ein neues Framework verbessert, wie grosse Sprachmodelle auf Edge-Geräten funktionieren können.

2025-07-25T10:54:18+00:00 ― 8 min Lesedauer

Ein neues System verbessert die Anpassungsfähigkeit grosser Sprachmodelle auf verschiedenen Geräten.

2025-05-22T21:38:15+00:00 ― 5 min Lesedauer