言語モデル評価のバイアス言語モデル評価のバイアス明らかにした。研究が人間とAIの判断におけるバイアスを計算と言語言語モデルの判断におけるバイアス研究によって、人間とLLMの応答評価における重大なバイアスが明らかになったよ。2025-09-07T05:12:36+00:00 ― 1 分で読む
新しい評価の下でのMLLM新しい評価の下でのMLLMsあることがわかった。新しいテストでMLLMの能力にギャップが計算と言語マルチモーダル大規模言語モデルの評価新しいベンチマークが、長いコンテキストを持つリアルワールドのタスクにおけるMLLMの課題を明らかにしてるよ。2025-08-15T10:16:00+00:00 ― 1 分で読む