数学の形式化における革命数学の形式化における革命るよ。4は複雑な数学の自動形式化手法を強化してLean計算と言語Lean 4を使ったオートフォーマリゼーションの進展新しい手法やベンチマークが、Lean 4を使って数学を形式化するのを簡単にすることを目指してるよ。2025-08-03T08:59:42+00:00 ― 1 分で読む
AIの推論スキルを評価するAIの推論スキルを評価する点を明らかにする。ベンチマークは言語モデルの推論の強みと欠計算と言語言語モデルの推論評価新しいベンチマークが言語モデルの推論スキルを評価する。2025-07-26T22:11:30+00:00 ― 1 分で読む