Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Xiaolin Sun

機械学習言語モデルにおける助けになりつつ安全性を保つこと

新しい方法が、大規模言語モデルの安全性と有用性を向上させることを目指している。

2025-09-01T20:50:06+00:00 ― 1 分で読む

機械学習攻撃に対する強化学習の強化

新しい手法が、敵対的な干渉からRLエージェントの安全性を向上させる。

2025-09-01T00:09:48+00:00 ― 1 分で読む