Simple Science

最先端の科学をわかりやすく解説

最先端の科学をわかりやすく解説

Binghong Wu

コンピュータビジョンとパターン認識テキスト中心の視覚的質問応答の進展

新しいデータセットSquare-10Mがオープンソースの視覚的質問応答機能を大幅に向上させたよ。

2025-08-18T02:31:12+00:00 ― 1 分で読む

計算と言語 LayTextLLMを使った文書処理の進歩

テキストとレイアウトをうまく組み合わせて、文書理解を向上させる新しいモデルを紹介するよ。

2025-07-20T12:48:00+00:00 ― 1 分で読む