Leyang Xue

Un nuevo sistema reduce la latencia en modelos de Mezcla de Expertos mientras controla los costos de memoria.

2025-09-14T10:36:54+00:00 ― 5 minilectura

Un nuevo sistema mejora la velocidad de los modelos de lenguaje en varias aplicaciones.

2025-09-14T10:13:12+00:00 ― 7 minilectura

Cómo la arquitectura de Mezcla de Expertos mejora el rendimiento en modelos de lenguaje.

2025-03-31T03:49:57+00:00 ― 9 minilectura