限られたデータでポリシーを限られたデータでポリシーを評価する正確な政策評価のための堅牢な方法。機械学習意思決定方針を評価する新しい方法限られたデータとログポリシーの不確実性を考慮した柔軟なアプローチで政策を評価する。2025-08-14T10:13:40+00:00 ― 1 分で読む