AIの推論能力を高めるAIの推論能力を高めるベリングを自動化する。新しい方法が言語モデルの推論ステップのラ計算と言語自動プロセスラベリングで言語モデルの推論を改善する新しい方法が言語モデルの推論を強化して、ステップラベリングを自動化する。2025-08-07T00:33:12+00:00 ― 1 分で読む
数学の形式化における革命数学の形式化における革命るよ。4は複雑な数学の自動形式化手法を強化してLean計算と言語Lean 4を使ったオートフォーマリゼーションの進展新しい手法やベンチマークが、Lean 4を使って数学を形式化するのを簡単にすることを目指してるよ。2025-08-03T08:59:42+00:00 ― 1 分で読む
AIの推論スキルを評価するAIの推論スキルを評価する点を明らかにする。ベンチマークは言語モデルの推論の強みと欠計算と言語言語モデルの推論評価新しいベンチマークが言語モデルの推論スキルを評価する。2025-07-26T22:11:30+00:00 ― 1 分で読む