汚職に強いAI学習汚職に強いAI学習わらず、AIの意思決定を向上させる。信頼できない人間のフィードバックにもかか機械学習AIにおける人間のフィードバックからの堅牢な学習データの破損があっても人間のフィードバックを使って強化学習を改善するアルゴリズムを開発中。2025-09-09T15:24:24+00:00 ― 1 分で読む
マルコフゲームの腐敗マルコフゲームの腐敗。競技ゲーム学習におけるデータ整合性の課題コンピュータ科学とゲーム理論マルコフゲームにおけるデータ破損の課題2人零和マルコフゲームにおけるデータ破損が学習戦略に与える影響を調査中。2025-09-01T23:36:00+00:00 ― 1 分で読む