言語モデルにおけるIRL言語モデルにおけるIRLる。ユーザー中心の学習でテキスト生成を変革す機械学習逆強化学習を用いた言語モデル訓練の進展IRLが言語モデルのパフォーマンスと多様性をどう向上させるかを見てみよう。2025-06-11T05:00:32+00:00 ― 1 分で読む