AIの脅威を軽減するAIの脅威を軽減するってる。新しいベンチマークが危険なAIの知識を狙機械学習WMDPベンチマークでAIリスクを対処する新しいベンチマークがAI関連の危険を測定して軽減することを目指してるよ。2025-09-01T08:35:24+00:00 ― 1 分で読む
AIの数学のスキルを評価すAIの数学のスキルを評価する投げかけている。調査結果はLLMの本当の推論能力に疑問を計算と言語言語モデルの数学における真の能力を評価する研究によって、大きな言語モデルの数学的推論能力についての懸念が明らかになった。2025-08-14T17:56:24+00:00 ― 1 分で読む