APIモデルテストのベンチAPIモデルテストのベンチマーク。複雑なAPIコールシーケンスのモデル評価人工知能APIを使うモデルを評価するための新しいベンチマークネストされたAPIコールを使った大規模言語モデルの新しい評価方法。2025-06-17T11:46:18+00:00 ― 1 分で読む