「静的な後悔」とはどういう意味ですか?
目次
スタティックレグレットは、意思決定のシナリオで使われる指標で、学習者が自分の選択が固定された選択肢と比べてどれくらい良いかを評価したいときに使うんだ。要するに、学習者が被ったトータルの損失と、固定された選択肢の中で一番良い選択がどれくらいの損失を出したかの差を見てる。
簡単に言うと、新しい情報が入ってきても選択を変えずにリストからベストな選択肢を探してると想像してみて。もしどのタイミングでもベストな選択肢に戻れるなら、スタティックレグレットは元々の選択肢と比べてどれだけ良くできたかを示してるんだ。
この概念は、時間をかけて決定を行う状況で使われるアルゴリズムや戦略を評価するのに役立つから、実際に選んだものと、もし学習者が完全な予見を持っていたら一番良い選択肢が何だったかを比較できるようにしてる。