合理化モデルが攻撃されてる合理化モデルが攻撃されてるに弱点があることがわかった。研究によると、敵対的脅威の際にAIの説明計算と言語攻撃に対抗するための合理化モデルを信頼することの課題この研究は、対立攻撃の下での合理化モデルの信頼性を調べてる。2025-06-25T01:52:00+00:00 ― 1 分で読む