Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Xinyue Shen

暗号とセキュリティ言語モデルへの脱獄攻撃：増大する脅威

脱獄攻撃の調査は、言語モデルの安全性に弱点があることを示してるね。

2025-09-09T19:37:12+00:00 ― 1 分で読む

暗号とセキュリティ UnsafeBenchで画像安全性分類器を評価する

新しいフレームワークは、悪影響のあるコンテンツに対する画像安全分類器の効果を評価する。

2025-08-13T09:48:48+00:00 ― 1 分で読む