Simple Science

最先端の科学をわかりやすく解説

機械学習言語モデルにおける推論時技術の新しいフレームワーク

この記事では、言語モデルの推論時間技術を強化するための新しいフレームワークを紹介します。

Jon Saad-Falcon, Adrian Gamarra Lafuente, Shlok Natarajan

― 1 分で読む

分散・並列・クラスターコンピューティングドミノ:大規模言語モデルの高速トレーニングへの新しいアプローチ

Dominoは、GPU間の通信を最適化することで言語モデルのトレーニング速度を向上させる。

Guanhua Wang, Chengming Zhang, Zheyu Shen

― 1 分で読む

コンピュータビジョンとパターン認識動画のエンゲージメントのためのコメント活用

中国の動画に対して魅力的なコメントを生成するための新しいデータセットとフレームワーク。

Yuyan Chen, Yiwen Qian, Songzhou Yan

― 1 分で読む

機械学習バイナリーブロックマスキングでフラッシュアテンションを改善する

新しい方法がスパースアテンションマスクのためにフラッシュアテンションのパフォーマンスを向上させる。

Agniv Sharma, Jonas Geiping

― 1 分で読む

コンピュータビジョンとパターン認識リージョンミックスアップ:データ拡張の新しいアプローチ

リージョンミックスアップは、より良いモデルパフォーマンスのためにトレーニングデータの多様性を高めるよ。

Saptarshi Saha, Utpal Garain

― 1 分で読む