マルチロジ評価:AIの推論マルチロジ評価:AIの推論テストしい知見。LLMのマルチステップ推論能力に関する新計算と言語言語モデルにおける多段階論理推論の評価新しいデータセットがLLMsの複雑な論理推論タスクに対する能力を評価してるよ。2025-07-25T01:57:06+00:00 ― 1 分で読む