ゲーム環境におけるLLMsゲーム環境におけるLLMsの評価しいベンチマーク。LLMのスキルとチームワークを評価する新計算と言語マルチエージェント環境での大規模言語モデルの評価新しいベンチマークが、LLMの複数エージェントとのインタラクションスキルを評価する。2025-09-04T00:58:30+00:00 ― 1 分で読む