新しいモデルは、インタラクティブゲーム理論の戦略を使って進化するデータポイゾニング脅威に適応する。
― 1 分で読む
最先端の科学をわかりやすく解説
新しいモデルは、インタラクティブゲーム理論の戦略を使って進化するデータポイゾニング脅威に適応する。
― 1 分で読む
大規模言語モデルにおけるプロンプト漏洩のリスクとその防止方法について。
― 1 分で読む
LoRDは、大規模言語モデルへのモデル抽出攻撃の効率を向上させる。
― 1 分で読む