Acyr Locatelli

A new method reduces KV cache size while maintaining high model performance.

2025-08-17T07:17:48+00:00 ― 5 min read

BAM enhances MoE efficiency by integrating attention and FFN parameters.

2025-06-27T12:35:24+00:00 ― 4 min read

Nexus combines efficiency, specialization, and adaptability in language model development.

2025-06-20T23:22:48+00:00 ― 6 min read