回路ブレーカーによるAI安回路ブレーカーによるAI安全性断する。新しい方法が有害なAIの出力を効果的に遮機械学習回路ブレーカーでAIの安全性を強化するサーキットブレーカーは、有害なAI出力を効果的に防ぐ新しい方法を提供する。2025-08-01T13:32:42+00:00 ― 1 分で読む
改ざん防止AIモデル改ざん防止AIモデルざんに対する安全性が向上したよ。新しい方法でオープンウェイトのLLMの改機械学習オープンウェイトLLMの安全性を強化する新しい方法がオープンウェイト言語モデルの改ざん耐性を改善する。2025-07-03T22:14:42+00:00 ― 1 分で読む