Simple Science

最先端の科学をわかりやすく解説

機械学習言語モデルにおける推論時技術の新しいフレームワーク

この記事では、言語モデルの推論時間技術を強化するための新しいフレームワークを紹介します。

Jon Saad-Falcon, Adrian Gamarra Lafuente, Shlok Natarajan

― 1 分で読む

機械学習バイナリーブロックマスキングでフラッシュアテンションを改善する

新しい方法がスパースアテンションマスクのためにフラッシュアテンションのパフォーマンスを向上させる。

Agniv Sharma, Jonas Geiping

― 1 分で読む