コンピューターサイエンス - マルチメディア

RSS

コンピュータビジョンとパターン認識マルチビュー表現学習技術の改善

マルチビューデータ表現の冗長性を減らす方法。

2025-08-28T19:32:00+00:00 ― 1 分で読む

音声・音声処理 CoAVTを使ったマルチモーダル処理の進展

CoAVTは、音声、映像、テキストデータを統合して、理解を深めるんだ。

2025-08-28T12:02:50+00:00 ― 1 分で読む

マルチメディア Virbo: アバターで動画制作を簡単にする

Virboの革新的なシステムを使って、簡単にトーキングアバター動画を作ろう。

2025-08-28T05:34:36+00:00 ― 1 分で読む

信号処理 WiMANSデータセット：WiFiを使った人間の活動追跡

WiMANSデータセットは、WiFi信号を使って複数のユーザーの活動を追跡できるんだ。

2025-08-28T03:08:25+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識動画編集のシンプルなアプローチ

新しいフレームワークが画像編集ツールを使って動画編集の作業を簡単にしてくれるよ。

2025-08-26T23:33:24+00:00 ― 1 分で読む

人工知能 BDoGでマルチモーダル推論を進める

BDoGは、さまざまなデータタイプをうまく統合することでAIの推論を改善するよ。

2025-08-26T15:47:18+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識ヘラクレス：画像と時系列データの新しいモデル

ヘラクレスはトランスフォーマーと状態空間モデルを組み合わせてデータ処理を改善してるよ。

2025-08-25T07:23:54+00:00 ― 1 分で読む

計算と言語音響データで音声認識を強化する

新しい方法が音響情報を言語モデルに統合して、もっと良い音声認識を実現するんだ。

2025-08-25T02:15:55+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション音楽でがんの理解を変える

音楽を使って癌を説明することで、理解度や関心を高めることができるよ。

2025-08-25T01:27:20+00:00 ― 1 分で読む

マルチメディアマルチモーダル知識グラフの完成を進める

新しいフレームワークが多様なデータタイプを使って知識グラフの補完を改善するよ。

2025-08-24T21:39:18+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識アニメーションポートレートの新しい方法

表情や角度が変わる肖像をアニメーションする新しい方法。

2025-08-23T20:54:06+00:00 ― 1 分で読む

画像・映像処理ポイントクラウド圧縮技術の改善

新しい方法が3Dデータの圧縮を質を保ちながら向上させた。

2025-08-23T16:15:25+00:00 ― 1 分で読む

情報検索 CIRPで商品バンドルを改善する

CIRPはアイテムの表現を強化して、より良いオンライン商品のバンドルを実現するよ。

2025-08-23T04:34:30+00:00 ― 1 分で読む

計算と言語感覚のインターネットの台頭

IoSが私たちのデジタル体験をどう変えていくのか、五感を使って探ってみる。

2025-08-23T04:26:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 DIBSフレームワークを使った密な動画キャプション生成の進展

DIBSは、ラベルのないデータを使って境界を調整することで、動画イベントのキャプションを改善するんだ。

2025-08-22T21:35:48+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識テキストと画像を使った3Dシーンモデリングの進歩

画像とテキストを組み合わせることで、3D深度推定の精度が向上するよ。

2025-08-22T08:33:42+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識メタバースにおけるWebXRの未来

WebXRは、没入型デジタル環境との関わり方を変える。

2025-08-21T07:24:48+00:00 ― 1 分で読む

マルチメディア口から音声に関する技術の進歩

新しい方法で、話せない人の音声合成が向上したよ。

2025-08-20T20:14:25+00:00 ― 1 分で読む

プログラミング言語 AniFrame：初心者向けのクリエイティブコーディングを簡単にするよ

AniFrameは、初心者でも簡単に使えるアプローチでプログラミングアートを身近にしてくれるよ。

2025-08-19T18:40:42+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識ニュースキャプションのためのテキストから画像合成の進展

新しいデータセットが複雑なニュースキャプションからの画像生成を向上させる。

2025-08-19T17:13:48+00:00 ― 1 分で読む

マルチメディア SNSでの誤情報のファクトチェック

新しい方法がSNSの主張のファクトチェックを改善する。

2025-08-19T05:30:42+00:00 ― 1 分で読む

マルチメディア Shotitの紹介：動画検索の新しい方法

Shotitは画像を使って動画をすぐに見つけることができるから、検索がめっちゃ楽になるんだ。

2025-08-18T10:01:30+00:00 ― 1 分で読む

情報検索コールドスタートシナリオでのレコメンデーション改善

事前データなしでおすすめを強化する新しいフレームワーク。

2025-08-17T21:15:12+00:00 ― 1 分で読む

マルチメディアペガサス-1: 動画理解のための新しいモデル

Pegasus-1はユーザーが自然な言葉で動画とやりとりできるようにするよ。

2025-08-17T17:10:18+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識ガウシアン・トーカーを使ったトーキングヘッド合成の進展

GaussianTalkerは、トーキングヘッドビデオの自然なリップシンクと高品質なビジュアルを提供するよ。

2025-08-17T09:24:12+00:00 ― 1 分で読む

マルチメディア漫画におけるキャラクター認識の革新的な方法

新しいアプローチで、マシンは事前のトレーニングなしにコミックキャラクターを特定できるようになる。

2025-08-17T09:00:30+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション動画クリエイターのための空間オーディオのアクセス向上

Mimosaはアマチュアのビデオメーカー向けに空間オーディオの制作を簡単にしてくれるよ。

2025-08-17T02:33:24+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識ユーザー生成コンテンツの動画品質評価

AIS 2024チャレンジは、ディープラーニングを使って動画の品質評価を向上させようとしてるんだ。

2025-08-16T21:01:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識リアルなデジタルヒューマン：ガウシアン・トーカーの台頭

GaussianTalkerは、リアルなトーキングヘッドでデジタルインタラクションを変革するよ。

2025-08-16T19:34:42+00:00 ― 1 分で読む

音声・音声処理ストリーミングでの字幕の増加傾向

字幕はストリーミングサービスの視聴体験を向上させるのに欠かせなくなってるね。

2025-08-16T05:18:30+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識ディープフェイクを検出する新しい方法

研究がディープフェイク動画の検出を改善する革新的な技術を紹介した。

2025-08-14T19:39:06+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 360+xデータセットの紹介：シーン理解の向上のために

新しいデータセットがロボットの現実世界の環境の解釈を改善する。

2025-08-13T18:11:55+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 UniAVの紹介: 動画ローカリゼーションの統一アプローチ

UniAVは、アクションの位置特定、音の検出、音声・映像イベントの位置特定を組み合わせて、動画の理解をより良くするんだ。

2025-08-13T10:06:05+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識物体検出技術の進歩

新しい方法が適応クエリを使って物体検出の性能を向上させる。

2025-08-13T07:50:18+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識ディープフェイク検出の難しさ

人間がディープフェイク動画を見分ける能力とAIの検出能力を比べてみる。

2025-08-12T22:05:42+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 AIが映像撮影に与える影響

AIが映像制作プロセスをどう変えてるか探ってるんだ。

2025-08-12T15:38:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 PEAVSの紹介：音声と映像の同期を測る新しい方法

PEAVSは、オーディオとビデオがどれだけうまく連携して、視聴者の体験を向上させるかを分析するんだ。

2025-08-12T03:19:55+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 CinePileの紹介: 動画理解の新しい基準

CinePileは、30万5千の多様な質問で長い動画の理解に挑戦してるんだ。

2025-08-11T01:11:48+00:00 ― 1 分で読む

暗号とセキュリティ QMedShield: 量子暗号で医療画像を守る

高度な量子技術を使ってクラウドで医療画像を保護する新しい方法。

2025-08-10T19:47:54+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 3Dモデルを使った食事分量の推定を進化させる

新しい方法が3Dモデルと2D画像を使って食品追跡の精度を向上させるんだ。

2025-08-10T18:56:35+00:00 ― 1 分で読む