Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Debmalya Mandal

機械学習 AIにおける人間のフィードバックからの堅牢な学習

データの破損があっても人間のフィードバックを使って強化学習を改善するアルゴリズムを開発中。

2025-09-09T15:24:24+00:00 ― 1 分で読む

コンピュータ科学とゲーム理論不確実な協力ゲームにおける安定配分の学習

この研究では、未知の環境で報酬を配分する方法を提案してるよ。

2025-09-09T09:44:42+00:00 ― 1 分で読む

機械学習変化する環境に強化学習を適応させる

エージェントの行動によって引き起こされる環境の変化を考慮した新しい強化学習のアプローチがあるよ。

2025-09-07T14:09:48+00:00 ― 1 分で読む

コンピュータ科学とゲーム理論マルコフゲームにおけるデータ破損の課題

2人零和マルコフゲームにおけるデータ破損が学習戦略に与える影響を調査中。

2025-09-01T23:36:00+00:00 ― 1 分で読む

コンピュータ科学とゲーム理論意外に人気のある投票で意思決定を再考する

新しい方法が部分的な好みに注目することで選択の精度を改善する。

2025-08-03T13:28:18+00:00 ― 1 分で読む

機械学習線形バンディットにおける隠れた対称性の発見

この研究は高次元線形バンディットの隠れた対称性に焦点を当ててるんだ。

2025-07-29T13:43:16+00:00 ― 1 分で読む

機械学習パフォーマティブ強化学習：新しいアプローチ

パフォーマティブRLがゲームのダイナミクスやポリシーの安定性にどう影響するか探ってるんだ。

2025-05-28T22:03:27+00:00 ― 1 分で読む

コンピュータ科学とゲーム理論混雑した意見の中で真実を見つける

投票が大人数の意見をどう明確にするかを見てみよう。

2025-05-23T21:07:39+00:00 ― 1 分で読む