コンピューターサイエンス - マルチメディア

RSS

コンピュータビジョンとパターン認識周波数分析による画像圧縮の進化

新しい方法は、周波数帯域に焦点を当てて画像圧縮を改善する。

2025-09-16T14:45:18+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 Vlogger: 動画制作の新しいツール

Vloggerは動画ブログを簡単にして、クリエイターにとってもっと早くて楽にしてくれるよ。

2025-09-16T11:12:00+00:00 ― 1 分で読む

マルチメディア動画ストリーミングの環境コスト

動画ストリーミングのエネルギー使用と環境への影響を調べる。

2025-09-16T01:59:00+00:00 ― 1 分で読む

サウンド新モデルで魚の給餌強度評価が向上したよ

音声と映像データを使って魚の食事を評価する統一的なアプローチ。

2025-09-14T21:03:15+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 AIが動画技術に与える影響

AIが動画制作とストリーミングをどう変えてるか見てみよう。

2025-09-13T11:18:36+00:00 ― 1 分で読む

画像・映像処理リアルなコミュニケーションのためのビデオ会議データセットの紹介

会議状況での動画品質テスト用のデータセット。

2025-09-13T03:45:30+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識新しいフレームワークで動画とテキストがもっと効果的に繋がるようになったよ。

研究者たちが、動画とテキストの理解を向上させるためのフレームワークを開発した。

2025-09-12T20:49:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識音声映像セグメンテーション技術の進展

新しい方法が詳細なラベルなしで音声と映像のセグメンテーションを向上させる。

2025-09-12T20:28:15+00:00 ― 1 分で読む

サウンド新しいシステムが不安定な頭の位置からの音声抽出を改善するよ。

PIAVEは、話し手が顔を背けても機械が声をクリアに抽出するのを助けるよ。

2025-09-12T19:39:40+00:00 ― 1 分で読む

音声・音声処理 MusiLingo: 音楽と言語をつなぐ

音楽と言語をつなげて理解を深める新しいシステム。

2025-09-11T14:30:40+00:00 ― 1 分で読む

マルチメディアシンプルな指標で効果的なポスターデザイン

メッセージを明確に魅力的に伝えるポスターのデザインを学ぼう。

2025-09-09T08:49:24+00:00 ― 1 分で読む

マルチメディア BDIQA: マインド理論を使って動画の質問応答を進化させる

新しいデータセットがAIの動画内の人間の行動を解釈する能力を高める。

2025-09-09T07:30:24+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクションスピカ：盲目のユーザーのための新しいツール

Spicaは、盲目や視覚障害のあるユーザー向けにインタラクティブな形で動画アクセスを向上させるよ。

2025-09-09T06:43:00+00:00 ― 1 分で読む

ロボット工学予測できないチャレンジのためのロボットテスト

予測できない環境でロボットのパフォーマンスを向上させる方法を探ってる。

2025-09-09T02:53:54+00:00 ― 1 分で読む

サウンド顔画像を使った音声変換技術の進展

顔の特徴を使って声を変える新しい方法がいろんな用途で使えるようになったよ。

2025-09-09T01:46:55+00:00 ― 1 分で読む

音声・音声処理 AV-SUPERBを紹介するよ：音声・映像モデルの新しいベンチマークだ！

AV-SUPERBは、より良いパフォーマンスのためにさまざまなタスクで音声と視覚のモデルを評価するよ。

2025-09-08T22:32:35+00:00 ― 1 分で読む

情報検索最新技術で動画検索を改善する

新しい方法は、いろんな情報の種類を組み合わせて動画検索を簡単にするよ。

2025-09-08T20:50:30+00:00 ― 1 分で読む

マルチメディア感情に敏感なマシンを作って、より良いインタラクションを！

感情に基づいて反応する機械を開発して、人間とコンピュータのインタラクションを向上させること。

2025-09-08T19:31:30+00:00 ― 1 分で読む

サウンド一貫性蒸留を使った高速テキストから音声生成

新しい方法でテキストからオーディオ生成のスピードと効率がアップしたよ。

2025-09-08T18:29:40+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識音源定位技術の進展

音声と映像データを使って音源の特定をもっと良くする方法。

2025-09-08T12:49:35+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識サウンドマッピング: サウンドスケープ分析への新しいアプローチ

高度な技術を使って、さまざまな環境で音を可視化したり予測したりする方法。

2025-09-08T11:12:25+00:00 ― 0 分で読む

マルチメディア Green-LL: ライブ動画ストリーミング体験の向上

モバイルライブビデオストリーミングの質とエネルギー効率を向上させる新しいアプローチ。

2025-09-08T06:13:36+00:00 ― 1 分で読む

情報検索 ChatDietでのパーソナライズされた食事提案

ChatDietは個人データと集団知識を組み合わせて、より良い食事アドバイスを提供するよ。

2025-09-07T00:28:12+00:00 ― 1 分で読む

マルチメディアテレビ討論：バイアスと礼儀の詳しい考察

インドのテレビ討論における偏見と無礼についての分析。

2025-09-06T18:16:54+00:00 ― 0 分で読む

画像・映像処理動画圧縮技術の進歩

新しいフレームワークが動画の圧縮効率と品質を向上させた。

2025-09-06T14:40:20+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクションプロパガンダにおける視覚メディアの役割

この記事は、ロシア・ウクライナ紛争中に画像が世論にどんな影響を与えたかを調べているよ。

2025-09-05T06:04:24+00:00 ― 1 分で読む

画像・映像処理騒がしい環境でのワイヤレス画像伝送の改善

新しい方法が、ノイズの多いチャンネルでの無線伝送中に画像の品質を向上させるよ。

2025-09-05T03:18:04+00:00 ― 1 分で読む

コンピュータと社会 MemeCraft: ソーシャルアドボカシーのための新しいツール

MemeCraftは、安全に社会的な理由を促進するための面白いミームを作ってるよ。

2025-09-04T14:48:00+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識スピード共同拡張で音声・映像学習を向上させる

新しい方法が音声・映像データの機械学習を強化する。

2025-09-04T05:59:30+00:00 ― 1 分で読む

計算と言語 RVSタスク：道案内の新しい見方

研究は、空間知識を使って方向を伝える幅広い方法を明らかにしている。

2025-09-03T23:39:30+00:00 ― 1 分で読む

信号処理統合失調症の症状を特定する新しいアプローチ

オーディオ、ビデオ、テキストを組み合わせて、メンタルヘルスの評価をより良くする。

2025-09-03T22:42:15+00:00 ― 0 分で読む

コンピュータビジョンとパターン認識トーキングフェイス生成技術の進歩

新しいフレームワークが話す顔の動画のリップシンクとビジュアル品質を向上させた。

2025-09-03T04:02:24+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識合成サンプルで欠陥検出を進める

新しい方法が、製造業の異常検出を改善するために偽の不良サンプルを生成するんだ。

2025-09-02T21:51:06+00:00 ― 1 分で読む

サウンド声と顔を組み合わせてより良い識別を実現

新しい手法が音声と映像データを統合してスピーカー認証を改善したよ。

2025-09-02T07:50:15+00:00 ― 0 分で読む

マルチメディア音声映像スピーカーの位置特定の進展

音声と視覚データを使ってスピーカートラッキングを強化する新しい方法。

2025-09-02T06:13:05+00:00 ― 1 分で読む

サウンド AIによる音楽生成の新しいモデル

MusicAOGは、革新的なグラフ表現を通じて音楽の制作と理解を簡単にするよ。

2025-08-31T08:52:25+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクション非典型的感情の重要性

ストレスやうつ病を分析することで、メンタルヘルスについての理解が深まるよ。

2025-08-31T02:02:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 FunnyNet-Wを使った動画のユーモア検出

新しいモデルがビデオの面白い瞬間を視覚、音声、テキストデータを使って特定するんだ。

2025-08-30T23:09:25+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 AesopAgent: 物語を動画に変える

AesopAgentを使えば、ユーザーはストーリーから動画を作れるんだ。高度なAIツールが使えるよ。

2025-08-30T18:32:18+00:00 ― 1 分で読む

ヒューマンコンピュータインタラクションウィキペディア学習における画像の役割

ウィキペディアの記事で画像が学習にどう影響するかを調べる。

2025-08-30T02:28:30+00:00 ― 1 分で読む