Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Ahmed Salem

暗号とセキュリティ新しい攻撃方法でAIの制限を回避できるようになったよ。

クレシェンド攻撃は、フレンドリーな会話を使ってAIモデルを有害な出力に操る。

2025-08-23T05:14:00+00:00 ― 1 分で読む

暗号とセキュリティ言語モデルのセキュリティ: 競争的アプローチ

競争は言語モデルのセキュリティにおける脆弱性と防御を明らかにする。

2025-07-29T17:12:36+00:00 ― 1 分で読む

暗号とセキュリティ言語モデルのフィンガープリンティングの新しい方法

言語モデルの所有権を証明するための新しいアプローチ。

2025-07-13T08:42:42+00:00 ― 1 分で読む

暗号とセキュリティ LLMエージェントのリスクと脆弱性

自律型言語モデルエージェントがもたらす脅威とその弱点を調べる。

2025-07-04T23:55:12+00:00 ― 1 分で読む