TABDetを紹介するよ。これはNLPタスクでバックドア攻撃を検出する新しい方法なんだ。
― 1 分で読む
最先端の科学をわかりやすく解説
TABDetを紹介するよ。これはNLPタスクでバックドア攻撃を検出する新しい方法なんだ。
― 1 分で読む
テキストデータにおける大規模言語モデルのプライバシー問題とその解決策を検討する。
― 1 分で読む
臨床言語モデルの脆弱性を調べて、患者の安全への影響を考える。
― 1 分で読む
TrojVLMは、ビジョン言語モデルの脆弱性を利用してバックドア攻撃を仕掛ける。
― 1 分で読む