Tong He

コンピュータビジョンとパターン認識無教師型動画物体位置特定の進展

新しい方法で、ラベル付きデータなしで動画の物体検出が改善されたよ。

2025-09-25T10:20:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 EoRaSを使った動画のアモダールセグメンテーションの進展

EoRaSは、動画セグメンテーションでの物体の形状理解を向上させるよ。

2025-09-22T15:11:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識自動運転車の物体検出の進展

新しい方法で、自動運転車がLiDARを使って物体を検出するのが改善されたよ。

2025-09-20T18:41:24+00:00 ― 1 分で読む

ロボット工学ロボット学習は観察方法によってどう変わるか

この記事では、観察の種類がロボットのタスク学習にどのように影響するかを検討しています。

2025-09-11T11:46:42+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識テキストから3Dモデルを作る新しい方法

新しいアプローチで、テキストの説明から効率よく詳細な3Dモデルを生成するよ。

2025-08-27T23:07:30+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識マルチモーダル大規模言語モデルにおける幻覚の対処法

MLLMにおける幻覚の簡潔な見方と信頼性を向上させるための戦略。

2025-08-15T14:44:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識アダプティブスロットアテンション：オブジェクト中心の学習への新しいアプローチ

この方法は、画像の複雑さに基づいてオブジェクト表現スロットを調整する。

2025-07-29T07:59:36+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 2Dでの人間の動き生成を進める

新しい2D人間動作データセットがリアルなアニメーションの扉を開く。

2025-07-27T13:12:06+00:00 ― 1 分で読む

機械学習空間的・時間的予測モデルの評価

新しいベンチマークが、空間的・時間的予測の標準評価の必要性に応えてるよ。

2025-07-15T01:47:30+00:00 ― 1 分で読む

計算と言語直接的な好み最適化で言語モデルを進化させる

研究者たちが言語モデルを人間の好みにもっと合うようにする方法を開発してるよ。

2025-07-14T07:29:24+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識視覚と言語の整合性技術の進展

新しいアプローチが画像とテキストのつながりを強化して、より良い解釈を実現するんだ。

2025-07-06T19:53:48+00:00 ― 1 分で読む

計算と言語リトリーバル拡張生成システムの評価

RAGシステムのパフォーマンスを評価するための新しいフレームワーク。

2025-06-27T07:51:00+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 DynaSurfGSを使った動的シーン再構築の進展

DynaSurfGSは、映像ベースのオブジェクトモデリングを画像品質と形状精度を向上させて強化するよ。

2025-06-22T15:00:42+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識レイアウトから画像生成技術の進歩

新しい方法で、複雑なテキスト説明からの画像生成が改善されてるよ。

2025-06-15T18:25:42+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 GigaGSによる3Dシーン再構築の進展

GigaGSは、大きな3Dシーンモデル作成の課題に革新的な技術で挑んでるよ。

2025-06-14T10:18:06+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 VideoLISA: ビデオオブジェクトセグメンテーションへの新しいアプローチ

VideoLISAは、動画の中で物体を効果的にセグメント化して追跡するために言語を使ってるんだ。

2025-06-03T09:15:24+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識動画のカメラ動作を追跡する新しい方法

高速移動するビデオシーンでカメラトラッキングを改善する新しいアプローチ。

2025-05-16T07:13:20+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識ファクタライズド量子化による視覚トークン化の進展

因子化量子化は、効率的なトークン管理を通じて画像生成を改善する。

2025-05-09T02:57:20+00:00 ― 1 分で読む

コンピュータビジョンとパターン認識 CoSurfGSで3Dサーフェス再構築を変革中

CoSurfGSは、デバイス間でのチームワークを活かした新しい3D再構築のアプローチを提供してるよ。

2025-01-30T14:34:48+00:00 ― 1 分で読む