ストリートビューの画像とデータを組み合わせて、建物の外観を分析する。
Zongrong Li, Yunlei Su, Chenyuan Zhu
― 1 分で読む
最先端の科学をわかりやすく解説
ストリートビューの画像とデータを組み合わせて、建物の外観を分析する。
Zongrong Li, Yunlei Su, Chenyuan Zhu
― 1 分で読む
グラウンドトゥルースのベンチマークなしでセグメンテーションの質を評価するモデル。
Ahjol Senbi, Tianyu Huang, Fei Lyu
― 1 分で読む
MedCLIP-SAMv2は、先進的なセグメンテーション技術と最小限のラベル付きデータを使って、腫瘍検出を改善するんだ。
Taha Koleilat, Hojat Asgariandehkordi, Hassan Rivaz
― 1 分で読む
CNNが画像の特徴をどうやって学習するのか、そしてその普遍的な類似点についての探求。
Florentin Guth, Brice Ménard
― 1 分で読む
研究者たちは、画像分析を改善することで生物多様性の追跡を向上させるためにCRISPを使用している。
Andy V. Huynh, Lauren E. Gillespie, Jael Lopez-Saucedo
― 1 分で読む
新しいインデックスが、AI生成の医療画像における多様性を評価するのに役立つよ。
Mohammed Talha Alam, Raza Imam, Mohammad Areeb Qazi
― 1 分で読む
新しい方法が動画のエンコードとデコードを速くしてるよ。
Hao Chen, Saining Xie, Ser-Nam Lim
― 1 分で読む
新しいフレームワークが画像とテキストのつながりを強化する。
Mayug Maniparambil, Raiymbek Akshulakov, Yasser Abdelaziz Dahou Djilali
― 0 分で読む
新しい見たことないデータに直面したとき、機械学習モデルがどうやって改善できるかを学ぼう。
Zongbo Han, Jialong Yang, Junfan Li
― 1 分で読む
画像生成における拡散モデルの役割と手法についての考察。
Zheyuan Zhan, Defang Chen, Jian-Ping Mei
― 1 分で読む
視覚的な質問を分解するためのマルチモーダルモデルを改善する方法を探ってる。
Haowei Zhang, Jianzhe Liu, Zhen Han
― 1 分で読む
新しいモデルは、3D CTスキャンから効率的で正確にレポートを生成するよ。
Hao Chen, Wei Zhao, Yingli Li
― 1 分で読む
2D画像から効率的に3Dモデルを生成する新しいパイプライン。
Potito Aghilar, Vito Walter Anelli, Michelantonio Trizio
― 1 分で読む
TrojVLMは、ビジョン言語モデルの脆弱性を利用してバックドア攻撃を仕掛ける。
Weimin Lyu, Lu Pang, Tengfei Ma
― 1 分で読む
この研究は、超音波画像を使って手のジェスチャーを認識する効果的な方法を明らかにしてる。
Keshav Bimbraw, Ankit Talele, Haichong K. Zhang
― 1 分で読む
新しいフレームワークは、エネルギーベースのモデルを使って、複数のソースからのデータ生成を改善するよ。
Shiyu Yuan, Jiali Cui, Hanao Li
― 1 分で読む
SATAは画像分類タスクにおけるビジョントランスフォーマーの堅牢性と効率を向上させる。
Nick Nikzad, Yi Liao, Yongsheng Gao
― 1 分で読む
新しい方法が、詳細なラベルなしでマスクを使った物体認識を改善するよ。
Heeseong Shin, Chaehyun Kim, Sunghwan Hong
― 1 分で読む
新しい方法が視覚データセットから不要なコンテンツを取り除くのを簡単にしてくれる。
Saehyung Lee, Jisoo Mok, Sangha Park
― 1 分で読む
患者のプライバシーを守りながら、医療画像を向上させるフェデレーテッドラーニングの役割を探る。
Nikolas Koutsoubis, Asim Waqas, Yasin Yilmaz
― 1 分で読む
新しい方法が、ロボットがオンラインの人間の動画を使ってタスクを学ぶ手助けをして、トレーニングの必要性を減らしてるよ。
Homanga Bharadhwaj, Debidatta Dwibedi, Abhinav Gupta
― 1 分で読む
PPLNは、イベントカメラのデータ処理を強化して、機械視覚の能力を向上させるんだ。
Chen Song, Zhenxiao Liang, Bo Sun
― 1 分で読む
新しいアプローチで、本物のサインと偽造を見分けるのがうまくいくようになった。
Hansong Zhang, Jiangjian Guo, Kun Li
― 1 分で読む
GoogLeNetの性能と解釈性に対する剪定方法の影響を分析する。
Jonathan von Rad, Florian Seuffert
― 1 分で読む
拡張現実と仮想現実のための深度マップを強化する革新的な方法。
Marcos V. Conde, Florin-Alexandru Vasluianu, Jinhui Xiong
― 1 分で読む
FASTは、専門家の入力が最小限でも、全スライド画像を使って疾患の分類を改善するよ。
Kexue Fu, Xiaoyuan Luo, Linhao Qu
― 1 分で読む
不正確なデータラベルでもモデルのパフォーマンスを向上させる方法。
Tong Wei, Hao-Tian Li, Chun-Shu Li
― 1 分で読む
MedViLaMは、分析と意思決定を向上させるために複数の医療データタイプを統合するよ。
Lijian Xu, Hao Sun, Ziyu Ni
― 1 分で読む
品質を損なうことなく、拡散モデルの出力を高速化する新しい方法。
Zhenyu Zhou, Defang Chen, Can Wang
― 1 分で読む
新しいモデルが脳CTスキャンからのレポート作成を効率化。
Chengxin Zheng, Junzhong Ji, Yanzhao Shi
― 1 分で読む
FlipClassは、一般化カテゴリ発見におけるより良い学習のための新しい方法を提供してるよ。
Haonan Lin, Wenbin An, Jiahao Wang
― 1 分で読む
新しい方法がリモートセンシング画像での向きのある物体の識別を強化する。
Jiaqi Zhao, Zeyu Ding, Yong Zhou
― 1 分で読む
ソース情報なしで時系列データを適応させる新しい方法。
Yucheng Wang, Peiliang Gong, Min Wu
― 1 分で読む
CIAIシステムは画像のノイズ検出を改善して、AIモデルの精度を向上させる。
Anubhooti Jain, Susim Roy, Kwanit Gupta
― 1 分で読む
グローバルとローカルのプロンプトを組み合わせることで、データプライバシーを保ちながらフェデレーテッドラーニングモデルを強化できるよ。
Bikang Pan, Wei Huang, Ye Shi
― 1 分で読む
VideoLISAは、動画の中で物体を効果的にセグメント化して追跡するために言語を使ってるんだ。
Zechen Bai, Tong He, Haiyang Mei
― 1 分で読む
新しい方法が、さまざまなアプリケーション向けの人間画像アニメーションのリアリズムを向上させる。
Zhongcong Xu, Chaoyue Song, Guoxian Song
― 1 分で読む
新しい方法がMRIの画像を改善して、スキャン中の動きを修正するんだ。
Constantin Slioussarenko, Pierre-Yves Baudin, Marc Lapert
― 1 分で読む
新しい手法がカメラ間の人物特定を監視を減らして向上させる。
Xuan Tan, Xun Gong, Yang Xiang
― 1 分で読む
新しい方法で、単一の動画入力から詳細な3Dモデルを作成できる。
Jeff Tan, Donglai Xiang, Shubham Tulsiani
― 1 分で読む