Deming Chen

Un nuevo método acelera la generación de texto de LLM usando cabezas de predicción adicionales.

2025-09-15T18:05:00+00:00 ― 5 minilectura

Un nuevo enfoque mejora el aprendizaje federado al abordar efectivamente a los clientes lentos.

2025-09-13T01:18:12+00:00 ― 10 minilectura

Un nuevo método reduce el tamaño de la caché KV mientras mantiene un alto rendimiento del modelo.

2025-08-17T07:17:48+00:00 ― 6 minilectura

Este artículo habla sobre los desarrollos recientes para mejorar la eficiencia en los Modelos de Lenguaje Grande.

2025-07-28T05:08:00+00:00 ― 7 minilectura