AIモデルがジェスチャーをAIモデルがジェスチャーを生成する測する。新しいモデルが会話中のリスナーの反応を予コンピュータビジョンとパターン認識モデルが会話中のリスナーのジェスチャーを予測する言語モデルを使って会話中にリアルなリスナーのジェスチャーを生成する研究。2025-10-06T06:31:00+00:00 ― 0 分で読む
TraveLERが動画QATraveLERが動画QAを変えるが向上した。新しいフレームワークで動画の質問応答能力コンピュータビジョンとパターン認識TraveLER: 動画質問応答への新しいアプローチTraveLERは、インタラクティブな質問を通じて動画理解を深めて、より良い回答を得られるようにするよ。2025-08-23T18:24:00+00:00 ― 1 分で読む