トカマク制御におけるRLトカマク制御におけるRL。強化学習技術を使って磁気制御を向上させるプラズマ物理学強化学習でトカマク制御を進化させるトカマクの磁気制御を強化学習でどう改善できるか調査中。2025-10-08T21:55:33+00:00 ― 1 分で読む
効率的な言語モデルのトレー効率的な言語モデルのトレーニング蒸留技術でAIの効率が革命的に変わる。機械学習蒸留を使った大規模言語モデルの効率改善リソースの使用を減らしながらLLMのパフォーマンスを向上させる新しい方法。2025-07-10T11:58:54+00:00 ― 1 分で読む
CLPで再考された言語モデCLPで再考された言語モデルーニングのための新しいフレームワーク。柔軟なマルチオブジェクティブファインチュ機械学習条件付けされた言語ポリシーで言語モデルを進化させる複数の目標をバランスさせるための言語モデルのファインチューニングのフレームワークを紹介するよ。2025-07-09T01:44:54+00:00 ― 1 分で読む