Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Lizhou Fan

計算と言語 MLLMの推論スキル評価の新しいベンチマーク

NPHardEval4Vは、マルチモーダルな大規模言語モデルの推論能力を評価する。

2025-09-01T13:19:48+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション BattleAgent: 歴史的戦争を新しい視点で見る

戦闘をシミュレーションして兵士の経験を明らかにするシステム。

2025-08-17T05:19:18+00:00 ― 1 分で読む

計算と言語言語モデルの推論能力の評価

この研究は、LLMが抽象的なシナリオと文脈的なシナリオでの推論をどう処理するかを調べてるよ。

2025-08-02T16:24:18+00:00 ― 1 分で読む

社会と情報ネットワークオンラインレビューで都市空間を改善しよう

オンラインレビューを活用して、みんなのために都市のアクセスを向上させる。

2025-06-13T08:37:36+00:00 ― 1 分で読む