言語モデルの脱獄防止 言語モデルの脱獄防止 ことを目指してる。 新しい方法が、有害な出力からモデルを守る 計算と言語 言語モデルの脱獄対策 研究者たちは、LLMが有害なコンテンツを生成しないようにする新しい方法を提案している。 Lang Gao, Xiangliang Zhang, Preslav Nakov Feb 3, 2025 ― 1 分で読む