Simple Science

Ciência de ponta explicada de forma simples

Ciência de ponta explicada de forma simples

Bharat Venkitesh

Computação e linguagem Melhorando a Eficiência do Cache KV para LLMs

Um novo método reduz o tamanho do cache KV enquanto mantém um alto desempenho do modelo.

2025-08-17T07:17:48+00:00 ― 6 min ler

Aprendizagem de máquinas Avanços em Modelos de Mistura de Especialistas com BAM

BAM melhora a eficiência do MoE ao integrar parâmetros de atenção e FFN.

2025-06-27T12:35:24+00:00 ― 5 min ler