Un nuevo método acelera la generación de texto de LLM usando cabezas de predicción adicionales.
― 5 minilectura
Ciencia de vanguardia explicada de forma sencilla
Un nuevo método acelera la generación de texto de LLM usando cabezas de predicción adicionales.
― 5 minilectura
La muestreo por sondeo mejora la eficiencia en las pruebas de seguridad de los modelos de lenguaje.
― 8 minilectura
Un nuevo método reduce el tamaño de la caché KV mientras mantiene un alto rendimiento del modelo.
― 6 minilectura
Un enfoque rentable para analizar imágenes y texto de alta resolución.
― 6 minilectura
Un nuevo método mejora la eficiencia en modelos de lenguaje grandes usando sparsidad de activación.
― 5 minilectura