Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Qingqing Ye

暗号とセキュリティゲーム理論を使ったデータポイズニング攻撃への防御

新しいモデルは、インタラクティブゲーム理論の戦略を使って進化するデータポイゾニング脅威に適応する。

2025-08-29T00:32:12+00:00 ― 1 分で読む

計算と言語言語モデルにおけるプロンプトリークの理解

大規模言語モデルにおけるプロンプト漏洩のリスクとその防止方法について。

2025-07-01T23:38:06+00:00 ― 1 分で読む

暗号とセキュリティローカリティ強化蒸留：モデル抽出攻撃の新しい手法

LoRDは、大規模言語モデルへのモデル抽出攻撃の効率を向上させる。

2025-06-17T05:03:24+00:00 ― 1 分で読む