Simple Science

最先端の科学をわかりやすく解説

「核サンプリング」とはどういう意味ですか?

目次

ヌクレウスサンプリングは、言語モデルを使ってテキストを生成する方法の一つだよ。これは、単語の選定をその確率に基づいて行うんだ。考慮するのはすべての単語じゃなくて、使われる可能性が高い小さなグループだけ。これを「ヌクレウス」って呼ぶんだ。

どうやって働くか

ヌクレウスサンプリングを使うとき、モデルはまず文の中で次に来る可能性の高い単語をランク付けするんだ。それからカットオフポイントを決めて、全確率の一定割合を占める上位の単語だけを残すんだ。例えば、カットオフが90%に設定されていると、モデルが予測する確率の90%を占める単語だけを見て、その中からランダムに単語を選ぶんだ。

メリットとデメリット

ヌクレウスサンプリングのメリットは、生成されるテキストにバラエティを加え、もっと面白くて多様になること。ただ、問題もあるんだ。ランダムさを制御する温度が低すぎると、モデルがフレーズを繰り返しちゃうことがあるし、高すぎると出力が不明瞭になったりごちゃごちゃしちゃうんだ。だから、ユーザーは異なるタスクごとに設定を調整する必要があって、ちょっと不便だよね。

核サンプリング に関する最新の記事