コンピューターサイエンス - マルチメディア

RSS

マルチメディア白内障手術のための動画ストレージ最適化

研究によると、白内障手術の動画を効果的に圧縮する方法があって、ストレージ管理が改善されるんだって。

2025-10-28T02:25:06+00:00 ― 1 分で読む

サウンド BERTを使った音楽分析：新しいアプローチ

研究はBERTのバー単位の音楽分析における可能性を探ってる。

2025-10-27T07:41:05+00:00 ― 1 分で読む

サウンド感情の文脈を加えたメロディーのハーモナイゼーションの進化

新しいモデルは感情要素を考慮してメロディのハーモナイゼーションを改善する。

2025-10-26T21:58:05+00:00 ― 1 分で読む

マルチメディアビデオ圧縮技術の進展

新しい方法が、品質と効率を維持しながら動画圧縮を改善する。

2025-10-26T05:46:25+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識スマートラベリングで食べ物のインスタンスセグメンテーションを改善する

新しいフレームワークが食品画像セグメンテーションの手動ラベリングコストを削減するよ。

2025-10-25T23:35:42+00:00 ― 1 分で読む

情報検索マルチモーダル推薦のための新しいフレームワーク

このフレームワークは、より良いレコメンデーションシステムのためにデータ処理を効率化するんだ。

2025-10-25T18:59:12+00:00 ― 1 分で読む

マルチメディア新しい技術で動画エンコーディング効率を改善する

新しい方法で動画のエンコードが速くなって、品質も保たれてるよ。

2025-10-25T14:30:36+00:00 ― 1 分で読む

サウンドシンプルなビートからメロディを作る

このプロジェクトは、誰でも基本的なビートと高度なコンピュータ技術を使って音楽を作るのを助けるよ。

2025-10-25T11:57:35+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識言語とビジュアルモデルの進歩

新しいモデルは、言語理解と画像処理を効率的に結びつける。

2025-10-25T06:20:48+00:00 ― 1 分で読む

マルチメディア音楽と動画のマッチングの新しいシステム

この研究は、音楽を映像コンテンツに効果的にマッチングするシステムを紹介してる。

2025-10-24T07:37:10+00:00 ― 1 分で読む

マルチメディアメタバース：新しいデジタルの風景

進化するメタバースと、そのコミュニケーションや経済への影響を発見しよう。

2025-10-24T03:21:18+00:00 ― 1 分で読む

コンピュータと社会教育用ビデオにおけるトランスクリプトの役割

トランスクリプトは教育動画の理解を深めて、音質の問題を解決するんだ。

2025-10-24T02:33:54+00:00 ― 1 分で読む

信号処理 SEPTを使った3Dポイントクラウド送信の進展

SEPTはディープラーニングを使って3Dポイントクラウドのワイヤレス伝送を改善するよ。

2025-10-23T03:16:45+00:00 ― 1 分で読む

情報検索動画ニュースのための新しい多言語データセット

このデータセットは、5つの言語でのビデオニュース検索を改善することを目的としてるよ。

2025-10-23T01:32:54+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識動画質問応答のためのフレーム選択の改善

新しい方法が、モデルが動画から質問に答えるためのフレームを選ぶ方法を向上させるよ。

2025-10-22T05:40:00+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識予測コーディングでビデオ通話を改善する

新しい方法がビデオ通話の品質を向上させつつ、帯域幅を節約する。

2025-10-22T03:02:00+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識写真をキャラクターの線画に変換する

ユーザーがコントロールできる写真からアーティスティックなラインドローイングを作る方法。

2025-10-19T23:25:12+00:00 ― 1 分で読む

マルチメディアインドネシア語のビデオ・テキストタスクの進展

新しいデータセットがインドネシア語話者のためのビデオ-テキストタスクを向上させる。

2025-10-19T21:32:45+00:00 ― 1 分で読む

サウンド音楽の類似性を測定する技術の進歩

研究は音声データとシンボリックデータを組み合わせて音楽の類似性分析を目指してるよ。

2025-10-19T11:49:45+00:00 ― 1 分で読む

マルチメディア拡散モデルを使った透かし攻撃手法の進展

新しい方法が画像のクオリティを保ちながら、ウォーターマークの除去を改善しているよ。

2025-10-18T23:41:00+00:00 ― 1 分で読む

計算と言語 mDTを使ったヘイトスピーチ検出の改善

新しい方法は、テキスト、画像、そして議論のコンテキストを組み合わせることでヘイトスピーチの検出を強化する。

2025-10-18T18:50:54+00:00 ― 1 分で読む

ネットワーキングとインターネット・アーキテクチャ AI駆動の予測でXRサービスの効率が向上

AIの予測が、高度なネットワークでの拡張現実ユーザーのサービスを向上させる。

2025-10-18T09:22:06+00:00 ― 1 分で読む

マルチメディア視覚的手がかりを使ってターゲットスピーカー抽出を改善する

新しいモデルが音声と視覚情報を使ってスピーチの抽出を強化したよ。

2025-10-17T12:51:55+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識新しいデータセットが変更された顔を検出することを目指してるよ。

RetouchingFFHQデータセットは、顔のレタッチ検出手法を強化するよ。

2025-10-17T11:46:30+00:00 ― 1 分で読む

マルチメディア LittleBeatsで赤ちゃんの睡眠モニタリングを革命的に変える

この研究は、赤ちゃんの睡眠パターンをもっと正確に追跡するためにマルチデータデバイスを使ってるよ。

2025-10-16T17:25:55+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 vTelos手法で画像注釈を改善する

機械学習における画像ラベリングの精度を向上させる新しいアプローチ。

2025-10-15T08:57:06+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識フレーム数を減らして効率的に動画アクション認識する

新しい手法は、重要なコンテキストを失わずにフレームを減らしてアクション認識を改善する。

2025-10-14T23:36:12+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識テキスト説明からの画像生成を改善する

新しい方法が画像とテキストの一致を向上させる。

2025-10-14T14:00:56+00:00 ― 0 分で読む

データベースブロックチェーンが著作権管理に与える影響

ブロックチェーン技術がクリエイターの著作権管理をどう変えるか探ってるよ。

2025-10-14T07:24:30+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識栄養失調を監視する革新的なスマホ方法

スマホの画像だけで健康を評価する新しい方法。

2025-10-13T21:47:48+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識ビジュアル分析で動画ラベリングを簡単にする

新しいツールが動画データのラベリングを効率的に行うプロセスを簡素化してるよ。

2025-10-13T11:00:00+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 StyleEDLを使った画像の感情理解

新しい方法が画像のスタイルと内容を組み合わせて感情を正確に解釈するんだ。

2025-10-12T03:24:00+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 FASTを使ったシーンテキスト編集の進展

FASTは、自然な変更と柔軟性でシーンテキスト編集を革新する。

2025-10-12T01:17:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識スケッチとテキストを使った3D形状生成の進展

新しい方法は、スケッチとテキストを組み合わせて3D形状生成を改善するんだ。

2025-10-12T00:46:00+00:00 ― 1 分で読む

マルチメディアプロンプトサービスにおける著作権保護

AIツールにおけるプロンプトの創作者の権利を守るための新しい枠組み。

2025-10-11T23:42:48+00:00 ― 1 分で読む

マルチメディア視覚と言語の事前学習方法の進展

新しいアプローチが視覚と言語の事前学習タスクの効率を向上させる。

2025-10-11T17:07:48+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 DiffSynthで動画制作を改善する

DiffSynthは、ちらつきを減らしてフレームブレンディングを改善することで動画の質を向上させるよ。

2025-10-11T07:46:54+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識スパイキングニューラルネットワークの進展：ミニマックス最適化によるモデル圧縮

ミニマックス最適化がスパイキングニューラルネットワークの効率をどう向上させるかについての考察。

2025-10-11T03:18:18+00:00 ― 1 分で読む

マルチメディアジェイド：動画ストリーミング品質への新しいアプローチ

Jadeはユーザーのフィードバックと適応ストリーミング技術で動画の質を向上させるよ。

2025-10-10T17:57:24+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識デザインにおける色選びの革新的モデル

新しいモデルはデザイン要素とテキストに基づいて色を提案するよ。

2025-10-10T17:49:30+00:00 ― 0 分で読む