マルチビューデータ表現の冗長性を減らす方法。
― 1 分で読む
最先端の科学をわかりやすく解説
マルチビューデータ表現の冗長性を減らす方法。
― 1 分で読む
CoAVTは、音声、映像、テキストデータを統合して、理解を深めるんだ。
― 1 分で読む
Virboの革新的なシステムを使って、簡単にトーキングアバター動画を作ろう。
― 1 分で読む
WiMANSデータセットは、WiFi信号を使って複数のユーザーの活動を追跡できるんだ。
― 1 分で読む
新しいフレームワークが画像編集ツールを使って動画編集の作業を簡単にしてくれるよ。
― 1 分で読む
BDoGは、さまざまなデータタイプをうまく統合することでAIの推論を改善するよ。
― 1 分で読む
ヘラクレスはトランスフォーマーと状態空間モデルを組み合わせてデータ処理を改善してるよ。
― 1 分で読む
新しい方法が音響情報を言語モデルに統合して、もっと良い音声認識を実現するんだ。
― 1 分で読む
音楽を使って癌を説明することで、理解度や関心を高めることができるよ。
― 1 分で読む
新しいフレームワークが多様なデータタイプを使って知識グラフの補完を改善するよ。
― 1 分で読む
表情や角度が変わる肖像をアニメーションする新しい方法。
― 1 分で読む
新しい方法が3Dデータの圧縮を質を保ちながら向上させた。
― 1 分で読む
CIRPはアイテムの表現を強化して、より良いオンライン商品のバンドルを実現するよ。
― 1 分で読む
IoSが私たちのデジタル体験をどう変えていくのか、五感を使って探ってみる。
― 1 分で読む
DIBSは、ラベルのないデータを使って境界を調整することで、動画イベントのキャプションを改善するんだ。
― 1 分で読む
画像とテキストを組み合わせることで、3D深度推定の精度が向上するよ。
― 1 分で読む
WebXRは、没入型デジタル環境との関わり方を変える。
― 1 分で読む
新しい方法で、話せない人の音声合成が向上したよ。
― 1 分で読む
AniFrameは、初心者でも簡単に使えるアプローチでプログラミングアートを身近にしてくれるよ。
― 1 分で読む
新しいデータセットが複雑なニュースキャプションからの画像生成を向上させる。
― 1 分で読む
新しい方法がSNSの主張のファクトチェックを改善する。
― 1 分で読む
Shotitは画像を使って動画をすぐに見つけることができるから、検索がめっちゃ楽になるんだ。
― 1 分で読む
事前データなしでおすすめを強化する新しいフレームワーク。
― 1 分で読む
Pegasus-1はユーザーが自然な言葉で動画とやりとりできるようにするよ。
― 1 分で読む
GaussianTalkerは、トーキングヘッドビデオの自然なリップシンクと高品質なビジュアルを提供するよ。
― 1 分で読む
新しいアプローチで、マシンは事前のトレーニングなしにコミックキャラクターを特定できるようになる。
― 1 分で読む
Mimosaはアマチュアのビデオメーカー向けに空間オーディオの制作を簡単にしてくれるよ。
― 1 分で読む
AIS 2024チャレンジは、ディープラーニングを使って動画の品質評価を向上させようとしてるんだ。
― 1 分で読む
GaussianTalkerは、リアルなトーキングヘッドでデジタルインタラクションを変革するよ。
― 1 分で読む
字幕はストリーミングサービスの視聴体験を向上させるのに欠かせなくなってるね。
― 1 分で読む
研究がディープフェイク動画の検出を改善する革新的な技術を紹介した。
― 1 分で読む
新しいデータセットがロボットの現実世界の環境の解釈を改善する。
― 1 分で読む
UniAVは、アクションの位置特定、音の検出、音声・映像イベントの位置特定を組み合わせて、動画の理解をより良くするんだ。
― 1 分で読む
新しい方法が適応クエリを使って物体検出の性能を向上させる。
― 1 分で読む
人間がディープフェイク動画を見分ける能力とAIの検出能力を比べてみる。
― 1 分で読む
AIが映像制作プロセスをどう変えてるか探ってるんだ。
― 1 分で読む
PEAVSは、オーディオとビデオがどれだけうまく連携して、視聴者の体験を向上させるかを分析するんだ。
― 1 分で読む
CinePileは、30万5千の多様な質問で長い動画の理解に挑戦してるんだ。
― 1 分で読む
高度な量子技術を使ってクラウドで医療画像を保護する新しい方法。
― 1 分で読む
新しい方法が3Dモデルと2D画像を使って食品追跡の精度を向上させるんだ。
― 1 分で読む