Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Guiming Hardy Chen

計算と言語言語モデルの判断におけるバイアス

研究によって、人間とLLMの応答評価における重大なバイアスが明らかになったよ。

2025-09-07T05:12:36+00:00 ― 1 分で読む

計算と言語マルチモーダル大規模言語モデルの評価

新しいベンチマークが、長いコンテキストを持つリアルワールドのタスクにおけるMLLMの課題を明らかにしてるよ。

2025-08-15T10:16:00+00:00 ― 1 分で読む