言語モデルの脱獄と戦う言語モデルの脱獄と戦うAIモデルに対する有害な攻撃への対策。暗号とセキュリティ言語モデルの脱獄攻撃と戦うスマート言語モデルを脅かすトリックを明らかにして、どう対抗するか。Zhiyu Xue, Guangliang Liu, Bocheng ChenMar 13, 2025 ― 1 分で読む