Jingdong Wang

新しいフレームワークが、さまざまな形式や粒度でのテキスト検出を改善したよ。

2025-08-04T13:26:06+00:00 ― 0 分で読む

BEVSpreadは、より安全な運転のために物体検出の精度を向上させるよ。

2025-07-30T04:24:06+00:00 ― 1 分で読む

新しい方法で音声に同期したリアルな顔のアニメーションが改善されてるよ。

2025-07-29T02:51:30+00:00 ― 1 分で読む

テキストからビデオモデルを評価する新しい方法は、ダイナミクスに着目してる。

2025-07-21T10:07:48+00:00 ― 1 分で読む

物体ごとの深さに焦点を当てた新しいアプローチが3D検出の精度を向上させる。

2025-07-13T06:12:36+00:00 ― 1 分で読む

SEEDは、デュアルクエリ選択と変形可能なグリッドアテンションを使って3Dオブジェクト検出を強化する。

2025-07-13T06:04:42+00:00 ― 1 分で読む

動画からリアルなデジタルアバターを作る新しい方法。

2025-07-09T12:48:30+00:00 ― 1 分で読む

新しい方法で、リニアグループRNNを使って3Dオブジェクト検出の精度と効率が向上した。

2025-07-07T03:32:00+00:00 ― 1 分で読む

Add-SDは、テキストプロンプトを使ってリアルなオブジェクトを追加できるから、画像編集を簡単にしてくれるんだ。

2025-07-05T02:09:30+00:00 ― 1 分で読む

ReSyncerは、音声に同期した口の動きのために、動画の品質と柔軟性を向上させるよ。

2025-07-01T12:18:42+00:00 ― 1 分で読む

FullAnnoは、マルチモーダルモデルのトレーニングをより良くするために画像アノテーションを強化する。

2025-06-08T20:15:54+00:00 ― 1 分で読む

この記事では、テキストと画像生成を一つのシステムに組み合わせた新しいモデルを紹介してるよ。

2025-06-06T22:34:36+00:00 ― 1 分で読む

FlipClassは、一般化カテゴリ発見におけるより良い学習のための新しい方法を提供してるよ。

2025-06-03T10:26:30+00:00 ― 1 分で読む

ALoREは、効率的な画像認識とより広い応用のためにモデルのトレーニングを最適化するよ。

2025-03-20T03:48:36+00:00 ― 1 分で読む