Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Danish Pruthi

暗号とセキュリティ AI生成テキストの透かし入れの課題

パラフレーズ攻撃に対するウォーターマーキング手法の脆弱性を調べる。

2025-05-28T23:21:45+00:00 ― 1 分で読む

計算と言語旅行の話やおすすめの偏り

旅行の物語における富が言語モデルにどう影響するかを調査中。

2025-05-26T00:40:30+00:00 ― 1 分で読む

計算と言語 AIに「ノー」と言わせる方法：ガイド

有害な質問を責任を持って拒否するための言語モデルのテクニックを評価する。

2025-03-24T15:20:42+00:00 ― 1 分で読む