Ying Shan

コンピュータビジョンとパターン認識 SEEDを紹介するよ：画像とテキストの新しいツールだよ。

SEEDは画像とテキストをつなげて、機械が視覚と文章の情報を処理する方法を向上させるんだ。

2025-10-19T11:02:36+00:00 ― 1 分で読む

計算と言語マルチモーダルモデルのための新しい評価ベンチマーク

新しいベンチマークが、マルチモーダル大規模言語モデルの評価を向上させることを目指してるよ。

2025-10-14T06:05:30+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 OmniZoomer: 360度画像を強化する新しい方法

OmniZoomerは、全方向画像のズーム品質を向上させて、より詳細に見えるようにするよ。

2025-10-08T12:45:48+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 Guide3D: 3Dアバター作成の新しいモデル

Guide3Dはテキストと画像を組み合わせて、高品質な3Dアバターを作るよ。

2025-10-07T05:57:12+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識オムニモーダル表現学習で機械学習を革新中

機械が多様なデータ形式をつなげて解釈するための新しいアプローチ。

2025-10-06T17:18:48+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 LoD-NeuSを使った3D表面再構築の進展

新しい手法は、LoD-NeuSを通じて3Dモデリングの詳細と品質を向上させる。

2025-09-24T11:18:06+00:00 ― 1 分で読む

情報検索 RecDCL: おすすめシステムの新しいアプローチ

RecDCLは、まばらなデータシナリオでよりユーザーに焦点を当てたおすすめをするための技術を組み合わせてるよ。

2025-09-13T21:19:00+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識オープンボキャブラリーオブジェクト検出の進展

物体検出の新しい手法は、さまざまなアプリケーションで柔軟性と効率を高めてるよ。

2025-09-13T08:32:42+00:00 ― 0 分で読む

コンピュータビジョンとパターン認識 ReVideo: 新しい映像編集のアプローチ

ReVideoは、コンテンツと動きを両方コントロールすることで、精密な動画編集を可能にするよ。

2025-08-09T01:00:24+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識静止画像をアニメーション化する：MOFA-ビデオアプローチ

MOFA-Videoが静止画像を魅力的なアニメーションに変える方法を学ぼう。

2025-08-04T07:38:30+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 CV-VAEを使った動画生成の進展

CV-VAEは既存のモデルにおける動画生成の効率と品質を向上させる。

2025-08-02T19:50:55+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 SynopGroundの紹介：ビデオグラウンディングへの新しいアプローチ

新しいデータセットと手法が複雑なストーリーのためのビデオグラウンディングを強化する。

2025-07-02T17:08:48+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 DepthCrafter: ビデオの深度推定を進化させる

動画シーケンスからの正確な深度推定のための新しい方法。

2025-06-17T22:49:54+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 Open-MAGVIT2: 画像生成のアクセス向上

高度な技術とモデルを使って画像生成を向上させるプロジェクト。

2025-06-16T02:43:24+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識イベントレベルの分析で動画理解を進める

新しいベンチマークがイベントレベルのタスクに焦点を当てて、動画理解の限界を押し広げてるよ。

2025-06-05T05:45:36+00:00 ― 0 分で読む

コンピュータビジョンとパターン認識 RF技術によるビジュアル制作の未来

RF技術が画像や動画の制作をどう変えてるかを見てみよう。

2025-05-28T08:34:21+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 NovelGSの紹介: 3Dイメージングのゲームチェンジャー

NovelGSは、スパース画像を使って効率的に素晴らしい3Dモデルを作るんだ。

2025-05-09T04:38:40+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 DOGEを紹介するよ: あなたの文書アシスタント

DOGEはドキュメントのやり取りを簡単にして、情報をアクセスしやすく、理解しやすくしてるよ。

2025-05-05T14:05:20+00:00 ― 1 分で読む

ロボット工学 Moto: ロボットの学び方が新しくなった

Motoはビデオ分析を使って、ロボットに複雑な動きを効率よく教えてるよ。

2025-04-12T02:19:30+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 Divotを使った動画処理の未来

Divotがどのように動画の理解と生成を変えるかを発見しよう。

2025-04-12T01:31:21+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 FreeSplatterで画像を3Dモデルに変換する

FreeSplatterは、カメラデータなしでランダムな画像から詳細な3Dモデルを作成するよ。

2025-03-17T00:22:30+00:00 ― 1 分で読む

サウンド MuMu-LLaMA: 音楽テクノロジーの未来

新しいモデルは音楽とAIを融合させて、革新的なメロディを作り出してるよ。

2025-03-16T01:48:00+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識カラーフロー：白黒アートを変える

ColorFlowは白黒画像に命を吹き込み、鮮やかな一貫性を保ってくれる。

2025-03-02T02:27:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 DI-PCG: 3Dアセット作成の革新

新しいツールが3Dモデル作成を簡単にして、アーティストやデザイナーの効率を上げてるよ。

2025-02-13T16:25:57+00:00 ― 1 分で読む