Tianle Cai

Un nuevo método acelera la generación de texto de LLM usando cabezas de predicción adicionales.

2025-09-15T18:05:00+00:00 ― 5 minilectura

La muestreo por sondeo mejora la eficiencia en las pruebas de seguridad de los modelos de lenguaje.

2025-09-02T04:52:00+00:00 ― 8 minilectura

Un nuevo método reduce el tamaño de la caché KV mientras mantiene un alto rendimiento del modelo.

2025-08-17T07:17:48+00:00 ― 6 minilectura

Un enfoque rentable para analizar imágenes y texto de alta resolución.

2025-07-05T16:14:48+00:00 ― 6 minilectura

Un nuevo método mejora la eficiencia en modelos de lenguaje grandes usando sparsidad de activación.

2025-06-22T07:38:18+00:00 ― 5 minilectura