AIのマルチイメージ推論とAIのマルチイメージ推論との戦いマンス評価。複雑な視覚タスクにおけるLLMのパフォーコンピュータビジョンとパターン認識AIモデルにおけるマルチイメージ推論の評価新しいデータセットが、LLMが複数の画像でどう推論するかを評価してるよ。2025-07-29T07:35:54+00:00 ― 1 分で読む
AIが論理パズルに挑戦!AIが論理パズルに挑戦!な論理パズルが得意だよ。トランスフォーマーは数独やシマウマみたい機械学習トランスフォーマーを使った論理パズル解決の強化因果言語モデルは、数独やゼブラパズルを解くのに有望だね。2025-06-11T10:24:42+00:00 ― 1 分で読む
ミケランジェロ:ミケランジェロ:言語モデル評価ワーク。長文の推論を評価するための新しいフレーム計算と言語ミケランジェロの紹介:言語モデルの新しい評価ミケランジェロは、長い文脈を通して推論する能力を評価するために言語モデルを評価してるよ。2025-06-09T07:51:06+00:00 ― 1 分で読む