OPE手法が攻撃を受けてるOPE手法が攻撃を受けてるデータ汚染は政策の評価を脅かしてる。機械学習オフポリシー評価手法のデータ攻撃に対する脆弱性データポイズニングが政策評価手法にどう影響するかを評価する。2025-08-21T22:49:06+00:00 ― 1 分で読む
言語モデルの忘却を見直す言語モデルの忘却を見直すしい方法。AIにおけるデータ消去のための効果的な新計算と言語言語モデルにおける機械的消去の改善新しい方法が言語モデルが特定の情報をうまく忘れさせる手助けをする。2025-06-08T19:12:42+00:00 ― 1 分で読む
ファインチューニング:ブーファインチューニング:ブーストかバンか?推論に与える影響を調査中。AIモデルにおけるファインチューニングが計算と言語言語モデルにおけるファインチューニングの影響言語モデルの推論に対するファインチューニングの影響を探る。2025-05-13T07:52:00+00:00 ― 1 分で読む