ALERTベンチマークは、言語モデルの安全リスクを評価して、応答を改善するんだ。
― 1 分で読む
最先端の科学をわかりやすく解説
ALERTベンチマークは、言語モデルの安全リスクを評価して、応答を改善するんだ。
― 1 分で読む
新しいシステムがAIモデルが生成した画像の安全リスクを評価するよ。
― 1 分で読む
Scarはテキスト生成における有害な言語を減らすことで、言語モデルを強化するよ。
― 1 分で読む
この記事では、機械学習におけるショートカット学習の問題とその対処法について考察しています。
― 1 分で読む
M-ALERTは、5つの言語で安全性のために言語モデルをテストするよ。
― 1 分で読む