# 統計学 # 機械学習 # 人工知能 # 計算と言語 # 機械学習

AIの次のステップ：エキスパートの構成

エキスパートの構成がAIの効果と効率をどう変えるかを探ってみて。

Swayambhoo Jain, Ravi Raju, Bo Li, Zoltan Csaki, Jonathan Li, Kaizhao Liang, Guoyao Feng, Urmish Thakkar, Anand Sampat, Raghu Prabhakar, Sumati Jairath

Apr 2, 2025 ― 1 分で読む

Composition of Expertsって何？
モジュラーアプローチの必要性
専門家を使うメリット
CoEはどう機能するの？
二段階ルーティングアプローチ
CoEのトレーニング
課題
システムの実装
メモリの考慮事項
実際の応用
1. カスタマーサポート
2. コンテンツ作成
3. 言語翻訳
CoEとAIの未来
結論
オリジナルソース

人工知能（AI）はもうSF映画で使われるかっこいい言葉じゃなくて、私たちの日常生活の一部になってるんだ。仕事の仕方やコミュニケーションの仕方、さらにはピザの注文の仕方まで影響を与えてる。技術が進化するにつれて、記事を書くことからソフトウェアのコーディングまで、いろんなことができる洗練されたAIシステムが増えてきてる。そんな中、面白いコンセプトが「Composition of Experts」、略してCoEって呼ばれるAIモデルの集合体なんだ。

Composition of Expertsって何？

Composition of Experts（CoE）は、異なる分野に特化した、スキルの高い専門家たちが集まって問題を解決するみたいなものなんだ。レストランに行って、各シェフがそれぞれ得意な料理を作ってる様子を想像してみて。あるシェフは最高のパスタを作り、別のシェフはデザートの達人、さらにもう一人は完璧なステーキを焼くのが得意って感じ。CoEは、単独のシェフに頼る代わりに、いろんなAIモデルを集めて、より良い解決策を提供するんだ。

モジュラーアプローチの必要性

AIの世界では、伝統的にはすべてを扱おうとする大規模な言語モデル（LLM）を作るのが一般的だったんだけど、これらのモデルは素晴らしいけど、自分自身にも問題があるんだよね。例えば、すごく優秀だけど不機嫌なシェフがすべての仕事をしようとするようなもので、コストが高かったり、更新が複雑だったり、カスタマイズが難しかったりするんだ。結局、誰のニーズにも合わない「画一的な」モデルになっちゃうことも。

そこで、CoEはもっとモジュラーなアプローチを採用して、必要に応じて異なる専門モデルを組み込むことができる。特定の作業がある時は、キッチン全体が混乱することなく、その仕事に最も適した専門家を簡単に選べるってわけ。

専門家を使うメリット

専門性: 寿司シェフにステーキを作ってもらうことはないように、専門家を使うことで、タスクを最適なモデルが処理してくれる。これがパフォーマンスや成果の質を向上させるんだ。
コスト効率: 必要な時にだけ専門家を使うことで、リソースをより効率的に活用できる。大きなモデルを動かさなくて済むから、計算力やコストを節約できるんだ。
柔軟性: 変化の速い世界では適応が大事。CoEなら、専門家を追加したり削除したりするのが簡単で、最初からやり直す必要がない。新しい専門家モデルが出てきたら、システムに簡単に組み込めるよ。

CoEはどう機能するの？

CoEには「ルーター」っていうのがあって、これは交通整理する警官みたいな役割を果たすんだ。入力が来ると、ルーターはその入力のタイプに基づいてどの専門家が最適かを判断する。まるでウェイターがキッチンでどのシェフに注文を送るかを知っているみたいなものだね。

二段階ルーティングアプローチ

入力分類: まず、システムは入力を特定のグループに分類する。例えば、料理について聞くと、そのシステムはそれを料理に関する質問として認識するんだ。
専門家マッピング: 次に、カテゴリーに基づいて、ルーターはその仕事を処理するのに最も適した専門家モデルを選ぶ。ここで、イタリア料理を専門とするシェフが素晴らしいパスタレシピを作ることもあるんだ。

CoEのトレーニング

CoEシステムのトレーニングは難しそうに聞こえるかもしれないけど、実際はルーターが適切な専門家を効果的に選ぶ方法を教えることなんだ。これにはラベル付きの例を提供して、入力を効率よくルーティングする方法を学ばせることが含まれるよ。

課題

トレーニングは常にスムーズに行くわけじゃない。入力にラベルをつけるのがややこしくなることもあって、似たような質問には異なる専門家が必要になることがあるんだ。まるで、2人の異なるシェフに同じ料理について意見を聞くようなもので、どちらも素晴らしいアイデアを持っているかもしれないけど、アプローチが全く違うかもしれない。

これを克服するために、二段階ルーティングアプローチが選択プロセスを明確にし、各カテゴリーに専門家がいることを保証してくれるんだ。

システムの実装

CoEが設定されたら、すべての専門家モデルを保存し、迅速にアクセスできるようにするために robust なメモリシステムが必要だよ。いろんなシェフが待機している料理番組を想像してみて。彼らを呼ぶのが早ければ早いほど、番組がスムーズに進行するんだ。

メモリの考慮事項

AI向けに設計された最新のシステムは、これらのモデルが必要とする大量のデータを管理するのに役立つ。専門家の間での素早い切り替えが可能になるので、シームレスなユーザー体験を維持するのに重要なんだ。

実際の応用

じゃあ、CoEシステムは何ができるのかって？可能性は無限大で、多様なんだ。

1. カスタマーサポート

CoEは、請求、技術サポート、製品情報など、さまざまな分野の顧客の質問に効果的に対応できる。それぞれの分野には、その質問を特定に扱うための専門AIモデルが設計されているんだ。

2. コンテンツ作成

記事を書くことからマーケティングコピーを生成することまで、CoEはコンテンツがカジュアルか、技術的か、エンターテイメントかに応じて最適な言語モデルを選べる。まるで、どんな作業にも対応できる専門的なライターのチームがいるみたいだね。

3. 言語翻訳

言語モデルは、一緒に働いてリアルタイムで正確な翻訳を提供することができる。それぞれの専門家が異なる言語や方言を扱うことで、コンテキストに基づいて最適な翻訳を保証するんだ。

CoEとAIの未来

CoEのようなモジュラーシステムの良さは、技術が進化するにつれて成長できることだよね。シェフが常にレシピを改善するように、AIの専門家もその能力を時間をかけて更新することができる。新しいモデルが開発されたら、主要な改修なしで簡単に統合できるんだ。

結論

Composition of Expertsシステムは、AIへのアプローチに新たな視点を提供してくれる。専門モデルのチームを活用することで、従来の「画一的」システムの欠点を解決している。このモジュラーで柔軟なアプローチは、効率を向上させるだけでなく、ユーザーがそれぞれのニーズに合ったベストな結果を得ることを保証するんだ。だから、次にAIとやりとりするときは、裏で働いている専門家のチームがいて、それぞれ自分の得意分野を持っているかもしれないことを思い出してね。あなたの体験をよりスムーズで楽しいものにしてるんだから。

オリジナルソース

タイトル: Composition of Experts: A Modular Compound AI System Leveraging Large Language Models

概要: Large Language Models (LLMs) have achieved remarkable advancements, but their monolithic nature presents challenges in terms of scalability, cost, and customization. This paper introduces the Composition of Experts (CoE), a modular compound AI system leveraging multiple expert LLMs. CoE leverages a router to dynamically select the most appropriate expert for a given input, enabling efficient utilization of resources and improved performance. We formulate the general problem of training a CoE and discuss inherent complexities associated with it. We propose a two-step routing approach to address these complexities that first uses a router to classify the input into distinct categories followed by a category-to-expert mapping to obtain desired experts. CoE offers a flexible and cost-effective solution to build compound AI systems. Our empirical evaluation demonstrates the effectiveness of CoE in achieving superior performance with reduced computational overhead. Given that CoE comprises of many expert LLMs it has unique system requirements for cost-effective serving. We present an efficient implementation of CoE leveraging SambaNova SN40L RDUs unique three-tiered memory architecture. CoEs obtained using open weight LLMs Qwen/Qwen2-7B-Instruct, google/gemma-2-9b-it, google/gemma-2-27b-it, meta-llama/Llama-3.1-70B-Instruct and Qwen/Qwen2-72B-Instruct achieve a score of $59.4$ with merely $31$ billion average active parameters on Arena-Hard and a score of $9.06$ with $54$ billion average active parameters on MT-Bench.

著者: Swayambhoo Jain, Ravi Raju, Bo Li, Zoltan Csaki, Jonathan Li, Kaizhao Liang, Guoyao Feng, Urmish Thakkar, Anand Sampat, Raghu Prabhakar, Sumati Jairath