HaloQuestがVLMHaloQuestがVLMの幻覚に挑む幻覚を減らす。新しいデータセットが評価を改善し、AIのコンピュータビジョンとパターン認識HaloQuest: VLMにおける幻覚への新しいアプローチHaloQuestは、視覚と言語のモデルにおける幻覚の問題に新しいデータセットで対処しているよ。2025-07-08T23:14:48+00:00 ― 1 分で読む
ミケランジェロ:ミケランジェロ:言語モデル評価ワーク。長文の推論を評価するための新しいフレーム計算と言語ミケランジェロの紹介:言語モデルの新しい評価ミケランジェロは、長い文脈を通して推論する能力を評価するために言語モデルを評価してるよ。2025-06-09T07:51:06+00:00 ― 1 分で読む