AIの脅威を軽減するAIの脅威を軽減するってる。新しいベンチマークが危険なAIの知識を狙機械学習WMDPベンチマークでAIリスクを対処する新しいベンチマークがAI関連の危険を測定して軽減することを目指してるよ。2025-09-01T08:35:24+00:00 ― 1 分で読む
改ざん防止AIモデル改ざん防止AIモデルざんに対する安全性が向上したよ。新しい方法でオープンウェイトのLLMの改機械学習オープンウェイトLLMの安全性を強化する新しい方法がオープンウェイト言語モデルの改ざん耐性を改善する。2025-07-03T22:14:42+00:00 ― 1 分で読む