言語モデルにおけるToM評言語モデルにおけるToM評価。AIの人間の信念についての推論を評価する人工知能言語モデルにおけるメタ認知の評価この記事では、LLMが人間の信念や感情をどう理解しているかを考察しています。2025-07-31T19:38:18+00:00 ― 1 分で読む
AIの時間的推論スキルの評AIの時間的推論スキルの評価論の課題を明らかにした。新しいベンチマークが言語モデルの時間的推計算と言語言語モデルにおける時間的推論の評価新しいベンチマークが、大きな言語モデルの時間的推論能力を評価してるよ。2025-07-17T23:10:48+00:00 ― 1 分で読む
デジタルヘルパーとしてのLデジタルヘルパーとしてのLLMこと。日常のタスクに信頼できる言語モデルを作る人工知能大規模言語モデルを信頼できるエージェントに変える信頼できるデジタルアシスタントとしてLLMを強化するための重要な側面に焦点を当てる。2025-04-10T13:24:36+00:00 ― 1 分で読む