Simple Science

最先端の科学をわかりやすく解説

# コンピューターサイエンス# コンピュータと社会

AIモデルのトレーニングコストの上昇

AI開発における増大する財政的要求を分析中。

― 1 分で読む


AIトレーニングのコストAIトレーニングのコストお金がかかるんだよね。AIモデルのトレーニングには、今やマジで
目次

近年、先進的なAIモデルのトレーニング費用が大幅に増加してるんだ。この傾向にもかかわらず、これらのコストがどれくらい高騰しているのか、どれだけ早く成長しているのかについての公的データはあまりないんだ。この記事は、ハードウェア、エネルギー、クラウド使用、スタッフの給与といった異なる視点からトレーニングコストを見て、そのギャップを埋めることを目指してる。

トレーニングコストの重要性

先進的なAIモデルのトレーニングには大量の計算パワーが必要で、それには相当な財政的投資が伴うんだ。これらのモデルを開発するためのコストは、主にハードウェアの購入、トレーニング中のエネルギー消費、そしてプロセスに関与するスタッフの給与の3つに分けられる。AIが進化し続けるにつれて、これらのコストは増加することが予想され、より小さな組織がついていくのが難しくなる。

主な発見

最近の分析によると、最も要求の厳しいAIモデルのトレーニングコストは2016年以降急激に上昇していて、年間で2倍以上のペースで上がってるんだ。例えば、GPT-4やGeminiのような有名なモデルには、高価な部品が必要で、その主な要因はAIチップのコストと、それを作るチームの給料なんだ。それぞれの費用は簡単に数千万ドルに達してしまう。

一部のケースでは、費用は以下のように分解される:

  • AIアクセラレーターチップ:コストの大部分は、AIタスク専用に設計された特殊なチップから来てる。
  • スタッフの給与:チームのコスト、給与や株式の提供も予算から大きな割合を占めることがある。
  • サーバーコンポーネント:サーバーの各種パーツやエネルギーコストも一部に含まれる。

この驚くべき傾向は、現在のコスト増加のペースが続けば、2027年までに一部の大規模なトレーニングプロジェクトが10億ドルを超える可能性があることを示してる。これは、大きくて資金力のある企業だけがこれらの先進的なAI開発を支えることができるということを意味してる。

トレーニングコストに関する公的データ

最近まで、具体的なトレーニングコストの見積もりはほとんどなかったんだ。しかし、他の研究グループとの協力によって、コスト見積もりの元となる広範な情報が明らかになった。この新しいデータは、コストの詳細な分析を可能にし、時間とともにこれらの費用がどれだけ急騰したかの重要な洞察を提供してる。

業界の専門家へのインタビューと機械学習モデルの詳細なデータベースを活用して、研究者たちはコストを3つの主なアプローチに分けることができた:

  1. 償却されたハードウェアコスト:これは、トータルハードウェアコストが機器の有用寿命にわたってどれだけ分散されているかを見積もる。

  2. クラウドレンタル価格:このアプローチは、クラウドコンピューティングリソースの歴史的なレンタル価格を見て、それに基づいて平均コストを算出する。

  3. 全体開発コスト:これにはトレーニングだけでなく、モデルを作成するためのすべての研究開発作業が含まれる。

コストの詳細

償却されたハードウェアコスト

最初のアプローチは、使用可能な期間にわたって分散された全体のハードウェアコストを計算することに焦点を当ててる。この方法では、特殊なAIチップ、サーバーハードウェア、ユーザーのネットワーク機器、エネルギー使用を見てコストを推定するんだ。結局のところ、最大の投資は一般的にAI計算用のチップに関連していて、メンテナンスやアップデートも総請求額に寄与してるんだ。

例えば、最近の費用見積もりによると、OpenAIのGPT-4モデルは約4000万ドルのコストがかかってる中で最も高価なモデルの一つだった。Googleの別のモデル、Gemini Ultraも約3000万ドルの高額な費用をかけてる。AIモデルがより複雑になるにつれて、トレーニングに関連するコストも大幅に上昇することは重要だね。

クラウドレンタル価格

2つ目の方法は、クラウドレンタル価格を使ってトレーニングコストを測定する。個々のハードウェア費用を分解するのではなく、このアプローチは、特定のモデルをトレーニングするのにかかるコストを推定するために歴史的なクラウドレンタル価格を利用する。興味深いことに、この方法は従来のハードウェア見積もり方法と比べて、しばしば高い平均コストを示すんだ。AIモデルを開発する組織は、一般に公開されていないレンタル契約を結ぶことが多いから。

クラウド価格を使うのは簡単だけど、組織が自分たちのハードウェアを持っている場合には過剰な見積もりにつながることもある。それでも両方のアプローチを考慮することで、コストの成長における全体的な傾向を検証できるし、個々の費用の不確実性に光を当てることができるんだ。

モデル開発の総コスト

3つ目の方法は、トレーニングの見積もりコストとモデル作成に関わるすべての研究開発作業を組み合わせる。この方法では、トレーニングの予想コストと初期作業の両方を組み込むことで、著名なAIモデルを開発するのにかかる費用を幅広く見ることができる。

いくつかの注目すべきモデルについて、この推定の内訳は、研究開発スタッフの給与と報酬が全体のコストのかなりの部分を占めることを示してる-総費用の29%から49%の範囲。コンピュータハードウェアの費用も大きな割合を占め、エネルギーコストは相対的に低いままだ。

費用の内訳

AIモデルのトレーニングに関連する個々の費用を掘り下げると、常に主要な寄与者として浮かび上がるいくつかの注目すべき要素があるんだ:

  1. AIアクセラレーターチップ:特定のAIタスクのために設計されたこれらの特殊なチップは、通常、総支出の重要な部分を占める。

  2. サーバーハードウェア:一般的なサーバーコスト、CPUやメモリを含むものが次に続き、予算のかなりの割合を占める。

  3. エネルギー使用:エネルギー消費のコストはハードウェアコストと比べると比較的低いけど、それでも重要な要素であり、計算パワーの需要の増加に伴い成長する可能性が高い。

費用の将来展望

現在のトレンドに基づくと、高度なAIプロジェクトに関連するトレーニングコストは減少することは期待できない。計算要件が急増する中で、先進的なモデルを運用するために十分な電力とリソースを確保することが大きな課題になってる。この成長する財政的障壁は、先進的なAI開発へのアクセスを大企業や政府機関に限るかもしれない。

医療、教育、環境、産業における累積コストは、これらの分野での大きな進展をもたらす可能性があるけど、それはそれに対して支出できる組織に限られる。現在の財政状況は、より小さな企業がついていくのが難しいことを示唆していて、AI分野における革新性やアクセスの問題に懸念が高まっている。

業界への影響

トレーニング費用が増加し続ける中、その影響はAIの開発にとって重要なものになる可能性がある。必要な資金を持っている主要なプレイヤーが限られている状況では、この急速に進化する分野での多様な思考や革新が減少することが懸念される。

さらに、このレベルの投資がAIの能力に大きな飛躍をもたらす可能性があることは、大きなプレイヤーと小さな企業との間の格差を深めることになる。これは、ガバナンス、AI技術の倫理、そしてその進展の恩恵が社会全体にどう広がるかについて重要な疑問を提起する。

結論

結論として、先進的なAIモデルのトレーニングコストの劇的な増加は、挑戦と機会の両方を提供する。費用が急上昇する中で、業界はアクセス、平等、そして技術を責任を持って活用する方法に関する問題に取り組む必要がある。将来の革新は、大企業と小規模企業、そして政策立案者が協力することによって、AI開発が責任を持って成長することを確保する必要があるかもしれない。

AIの動向は鈍化する兆しを見せてなくて、コストが上昇する中で、今日の決定が今後何年にもわたって技術の風景を形作るかもしれない。AI開発の未来は、リソースをうまく管理し、協力を促進し、革新が排他的ではなく包括的であることを確保することに大きく依存しているかもしれない。

オリジナルソース

タイトル: The rising costs of training frontier AI models

概要: The costs of training frontier AI models have grown dramatically in recent years, but there is limited public data on the magnitude and growth of these expenses. This paper develops a detailed cost model to address this gap, estimating training costs using three approaches that account for hardware, energy, cloud rental, and staff expenses. The analysis reveals that the amortized cost to train the most compute-intensive models has grown precipitously at a rate of 2.4x per year since 2016 (95% CI: 2.0x to 3.1x). For key frontier models, such as GPT-4 and Gemini, the most significant expenses are AI accelerator chips and staff costs, each costing tens of millions of dollars. Other notable costs include server components (15-22%), cluster-level interconnect (9-13%), and energy consumption (2-6%). If the trend of growing development costs continues, the largest training runs will cost more than a billion dollars by 2027, meaning that only the most well-funded organizations will be able to finance frontier AI models.

著者: Ben Cottier, Robi Rahman, Loredana Fattorini, Nestor Maslej, David Owen

最終更新: 2024-05-31 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2405.21015

ソースPDF: https://arxiv.org/pdf/2405.21015

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事