Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

David Atanasov

計算と言語言語モデルを守る新しいアプローチ

研究がRepNoiseを紹介して、大規模言語モデルを有害なファインチューニングから守る。

2025-08-08T06:18:36+00:00 ― 1 分で読む

機械学習大規模言語モデルのリスクに対処する

リバースプリファレンス攻撃とそのモデルの安全性への影響を探る。

2025-06-09T11:08:36+00:00 ― 1 分で読む