Yingyan Celine Lin

Investigación sobre cómo mejorar la eficiencia de los modelos de lenguaje usando atención lineal y decodificación especulativa.

2025-07-30T11:38:36+00:00 ― 9 minilectura

Explorando cómo los sinks de atención afectan el rendimiento de los modelos de lenguaje y presentando una técnica de calibración.

2025-07-25T11:02:12+00:00 ― 7 minilectura

Un nuevo marco mejora cómo los modelos de lenguaje grandes pueden funcionar en dispositivos de borde.

2025-07-25T10:54:18+00:00 ― 9 minilectura

Un nuevo sistema mejora la adaptabilidad de los modelos de lenguaje grandes en diferentes dispositivos.

2025-05-22T21:38:15+00:00 ― 6 minilectura