生成AIのセキュリティリスクを赤チームと青チームで対処する。
― 1 分で読む
最先端の科学をわかりやすく解説
生成AIのセキュリティリスクを赤チームと青チームで対処する。
― 1 分で読む
MoJEはLLMのためのガードレールを強化していて、脱獄攻撃に効果的に対処してるよ。
― 1 分で読む
この研究は、大きな言語モデルがどうやって不正行動したり操られたりするかを調べてるんだ。
― 1 分で読む
グラナイト・ガーディアンはAIの会話を有害なコンテンツからしっかり守るよ。
― 1 分で読む