「ソリッド」とはどういう意味ですか?
目次
SOLIDは、ユーザーが何を求めているかを理解する会話を作るための方法だよ。人が質問するとき、その目標をシステムが知っていることが大事なんだけど、システムにその目標を認識させるのは結構大変で、たくさんのラベル付き例が必要なんだ。
そこで、SOLIDは事前の例を必要とせずに会話を生み出せる大規模言語モデルを使ってるよ。主なアイデアは2つあって、セルフシーディングとマルチインテントセルフインストラクティングなんだ。
セルフシーディング
セルフシーディングは、システムが既に知っていることを基に会話を始めることができるようにする機能で、生成される対話がより関連性があって意味のあるものになるんだ。
マルチインテントセルフインストラクティング
マルチインテントセルフインストラクティングは、システムが段階的に対話を作る手助けをするよ。人間からの具体的なプロンプトを必要とせず、システム自身が指示を調整する方法を見つけるんだ。特に複雑なトピックや複数の目標があるときにね。
SOLID-RL
SOLIDの拡張版であるSOLID-RLは、SOLIDが生成した対話を使って、一度で完璧な会話を作るようにトレーニングされているんだ。これによって、会話の質が常に向上することが保証されてるよ。
結果
SOLIDとSOLID-RLを使えば、30万以上の意味のある会話を作ることができるんだ。テストでも、これらの生成された対話を使ってトレーニングされた方法が、人間が作った対話を使ったものよりもユーザーの目標を理解するのが得意だって実証されてるよ。