Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Severin Field

計算と言語 AIモデルにおけるアラインメントフェイカーの検出

安全だと偽っているAIモデルを見分けるためのベンチマーク。

2025-08-12T19:11:54+00:00 ― 1 分で読む