Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Maxwell Lin

機械学習回路ブレーカーでAIの安全性を強化する

サーキットブレーカーは、有害なAI出力を効果的に防ぐ新しい方法を提供する。

2025-08-01T13:32:42+00:00 ― 1 分で読む

機械学習オープンウェイトLLMの安全性を強化する

新しい方法がオープンウェイト言語モデルの改ざん耐性を改善する。

2025-07-03T22:14:42+00:00 ― 1 分で読む