LLMのコード推論を評価すLLMのコード推論を評価する理を理解してるかテストするよ。新しいフレームワークがプログラミングの論ソフトウェア工学大規模言語モデルにおけるコード推論の評価コードタスクに対するLLMの理解を評価するための新しいフレームワーク。2025-09-08T08:35:48+00:00 ― 1 分で読む