ALERTベンチマークは、言語モデルの安全リスクを評価して、応答を改善するんだ。
― 1 分で読む
最先端の科学をわかりやすく解説
ALERTベンチマークは、言語モデルの安全リスクを評価して、応答を改善するんだ。
― 1 分で読む
RedPajamaデータセットは、透明性と質の高いデータを通じて言語モデルのトレーニングを向上させることを目指してるよ。
― 1 分で読む
M-ALERTは、5つの言語で安全性のために言語モデルをテストするよ。
― 1 分で読む