視覚とテキストがコリファレ視覚とテキストがコリファレンスタスクで出会う視覚データで言語処理を強化する。計算と言語イベントのコアフェレンス解決のためのビジュアルとテキストの組み合わせ画像とテキストを使ってイベントのコアフェレンス解決を強化する方法。2025-08-19T23:25:06+00:00 ― 1 分で読む