Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Bochuan Cao

機械学習新しい攻撃戦略がLLMの安全性にリスクをもたらす

研究によると、WordGame攻撃が明らかになり、LLMの安全対策の弱点を突いているんだって。

2025-08-09T04:17:54+00:00 ― 1 分で読む

計算と言語言語モデルの応答に関する新しい洞察

新しい方法で言語モデルの出力を理解するのが上手くなった。

2025-08-04T08:02:12+00:00 ― 1 分で読む

計算と言語言語モデルの自己修正能力

言語モデルにおける自己修正プロセスとその影響を探る。

2025-08-02T12:27:18+00:00 ― 1 分で読む

暗号とセキュリティ AIにおける stealthy バックドア攻撃の増加

新しい方法で、クリーンデータやモデルの変更なしにバックドア攻撃ができるようになった。

2025-03-27T16:22:21+00:00 ― 1 分で読む