Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Bharat Venkitesh

計算と言語 LLMのKVキャッシュ効率を改善する

新しい方法でKVキャッシュサイズを減らしつつ、高いモデルパフォーマンスを維持できる。

2025-08-17T07:17:48+00:00 ― 1 分で読む

機械学習 BAMを使ったエキスパートモデルの進歩

BAMは、アテンションとFFNパラメータを統合することでMoEの効率を向上させるよ。

2025-06-27T12:35:24+00:00 ― 1 分で読む