Zhongzhi Yu

Explorando cómo los sinks de atención afectan el rendimiento de los modelos de lenguaje y presentando una técnica de calibración.

2025-07-25T11:02:12+00:00 ― 7 minilectura

Un nuevo marco mejora cómo los modelos de lenguaje grandes pueden funcionar en dispositivos de borde.

2025-07-25T10:54:18+00:00 ― 9 minilectura

KVMerger reduce el uso de memoria en modelos de lenguaje mientras mantiene el rendimiento a través de una fusión efectiva de estados.

2025-07-15T02:19:06+00:00 ― 7 minilectura

Un nuevo sistema mejora la adaptabilidad de los modelos de lenguaje grandes en diferentes dispositivos.

2025-05-22T21:38:15+00:00 ― 6 minilectura