Simple Science

最先端の科学をわかりやすく解説

分散・並列・クラスターコンピューティングドミノ:大規模言語モデルの高速トレーニングへの新しいアプローチ

Dominoは、GPU間の通信を最適化することで言語モデルのトレーニング速度を向上させる。

Guanhua Wang, Chengming Zhang, Zheyu Shen

― 1 分で読む

コンピュータビジョンとパターン認識動画のエンゲージメントのためのコメント活用

中国の動画に対して魅力的なコメントを生成するための新しいデータセットとフレームワーク。

Yuyan Chen, Yiwen Qian, Songzhou Yan

― 1 分で読む

機械学習バイナリーブロックマスキングでフラッシュアテンションを改善する

新しい方法がスパースアテンションマスクのためにフラッシュアテンションのパフォーマンスを向上させる。

Agniv Sharma, Jonas Geiping

― 1 分で読む

コンピュータビジョンとパターン認識リージョンミックスアップ:データ拡張の新しいアプローチ

リージョンミックスアップは、より良いモデルパフォーマンスのためにトレーニングデータの多様性を高めるよ。

Saptarshi Saha, Utpal Garain

― 1 分で読む