Acyr Locatelli

Nuevos métodos mejoran la eficiencia y el rendimiento en redes neuronales usando Mezcla de Expertos.

2025-09-28T04:10:36+00:00 ― 8 minilectura

Un nuevo método reduce el tamaño de la caché KV mientras mantiene un alto rendimiento del modelo.

2025-08-17T07:17:48+00:00 ― 6 minilectura

BAM mejora la eficiencia de MoE al integrar parámetros de atención y FFN.

2025-06-27T12:35:24+00:00 ― 5 minilectura

Nexus combina eficiencia, especialización y adaptabilidad en el desarrollo de modelos de lenguaje.

2025-06-20T23:22:48+00:00 ― 7 minilectura