Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Zhang-Wei Hong

機械学習好奇心に基づくレッドチーミングで言語モデルの安全性を向上させる

新しい方法が言語モデルのテストの堅牢性を高め、斬新さを優先してるよ。

2025-09-02T23:33:48+00:00 ― 1 分で読む

機械学習深層強化学習における探索の強化

ランダム潜在探索を紹介するよ：エージェントの探索を改善する新しいアプローチだ。

2025-07-11T05:21:42+00:00 ― 1 分で読む