新しい方法で自動運転車の周囲の認識が向上する。
Xiaohu Lu, Hayder Radha
― 1 分で読む
New Science Research Articles Everyday
新しい方法で自動運転車の周囲の認識が向上する。
Xiaohu Lu, Hayder Radha
― 1 分で読む
画像とテキストを結びつける画期的なモデルが、情報検索を向上させる。
Andreas Koukounas, Georgios Mastrapas, Bo Wang
― 1 分で読む
外部メモリバンクが拡散モデルを強化して、画像や音の作成をより良くする。
Yi Tang, Peng Sun, Zhenglin Cheng
― 1 分で読む
新しい方法で、モデルが視覚情報を効率的に処理するのが改善された。
Ke Wang, Hong Xuan
― 1 分で読む
タスクフィンガープリンティングは、医療画像における知識共有を変革するかもしれない。
Patrick Godau, Akriti Srivastava, Tim Adler
― 1 分で読む
視覚言語モデルを使った積極的な方法が隠れたバックドア攻撃を検出することを目指している。
Kyle Stein, Andrew Arash Mahyari, Guillermo Francia
― 1 分で読む
研究がAIの幾何学理解を向上させるための新しいベンチマークを明らかにした。
Jiarui Zhang, Ollie Liu, Tianyu Yu
― 1 分で読む
新しいVisionArenaデータセットをチェックして、リアルユーザーチャットでAIのインタラクションを強化しよう。
Christopher Chou, Lisa Dunlap, Koki Mashita
― 1 分で読む
StreamChatは、リアルタイムでストリーミングビデオにどう関わるかを変えてくれる。
Jihao Liu, Zhiding Yu, Shiyi Lan
― 1 分で読む
3Dメッシュ編集をもっと速くて簡単にして、クリエイティビティを引き上げる方法を見つけよう。
Will Gao, Dilin Wang, Yuchen Fan
― 1 分で読む
FPAがテキストからの画像生成を素早く正確に改善する方法を学ぼう。
Khalil Mrini, Hanlin Lu, Linjie Yang
― 1 分で読む
この新しい方法は、テキストコマンドを使って画像編集をスムーズにするんだ。
Vladimir Kulikov, Matan Kleiner, Inbar Huberman-Spiegelglas
― 1 分で読む
先進技術がデザインと衣服制作のギャップを埋める。
Feng Zhou, Ruiyang Liu, Chen Liu
― 1 分で読む
ASDnBが体の言語や顔のサインを通じてスピーカーの検出をどう強化するかを発見しよう。
Tiago Roxo, Joana C. Costa, Pedro Inácio
― 1 分で読む
AIロボットは、動きを向上させるために実際の室内動画を通じてナビゲーションを学んでるんだ。
Mingfei Han, Liang Ma, Kamila Zhumakhanova
― 1 分で読む
SAM-Mixは医療画像解析を改善して、手作業を減らし、精度を高めるよ。
Tyler Ward, Abdullah-Al-Zubaer Imran
― 1 分で読む
オンラインショッピングのための平面画像で、今までにない服を見てみよう。
Ioannis Xarchakos, Theodoros Koukopoulos
― 1 分で読む
手軽に安くビジュアルプログラムを作る新しい方法を見つけよう。
Michal Shlapentokh-Rothman, Yu-Xiong Wang, Derek Hoiem
― 1 分で読む
衛星画像と地上画像を組み合わせた新しいツールで、土地のマッピングがより良くなるよ。
Pallavi Jain, Dino Ienco, Roberto Interdonato
― 1 分で読む
新しいアプローチでは、詳細な3Dモーションキャプチャのためにニューラルフィールドと変形モデルを組み合わせてるんだ。
Aymen Merrouche, Stefanie Wuhrer, Edmond Boyer
― 1 分で読む
コンピュータが人間の動作を物体と共にどやって認識するかの深掘り。
Mingda Jia, Liming Zhao, Ge Li
― 1 分で読む
テキストと画像を組み合わせることで感情分析がどう強化されるかを学ぼう。
Nguyen Van Doan, Dat Tran Nguyen, Cam-Van Thi Nguyen
― 1 分で読む
自己教師あり学習が脳画像におけるアルツハイマーの検出をどう変えるかを発見しよう。
Hao-Chun Yang, Sicheng Dai, Saige Rutherford
― 1 分で読む
新しい技術で簡単にリアルな人の画像が生成できる。
Zijian Zhou, Shikun Liu, Xiao Han
― 1 分で読む
CATがどんな風に革新的なデータ戦略で機械学習を改善するかを発見しよう。
Sumaiya Zoha, Jeong-Gun Lee, Young-Woong Ko
― 1 分で読む
POINTS1.5が画像とテキスト処理能力をどう向上させるかを発見しよう。
Yuan Liu, Le Tian, Xiao Zhou
― 1 分で読む
WavFusionは、音声、テキスト、ビジュアルを組み合わせて、感情認識を向上させるんだ。
Feng Li, Jiusong Luo, Wanjun Xia
― 1 分で読む
LOMAは、視覚的要素と言語的要素を組み合わせて、より良い3D空間の予測を行うよ。
Yubo Cui, Zhiheng Li, Jiaqiang Wang
― 1 分で読む
新しいフレームワークが自動運転車のデータラベリングを強化するよ。
Yushan Han, Hui Zhang, Honglei Zhang
― 1 分で読む
新しい方法で、少ないデータで動画の予測が改善されるよ。
Gaurav Shrivastava, Abhinav Shrivastava
― 1 分で読む
ALoREは、効率的な画像認識とより広い応用のためにモデルのトレーニングを最適化するよ。
Sinan Du, Guosheng Zhang, Keyao Wang
― 1 分で読む
3Dの占有予測が自動運転車の技術にどう影響してるか。
Bohan Li, Xin Jin, Jiajun Deng
― 1 分で読む
革新的なDMICフレームワークが異なるカメラタイプでの人物認識を向上させる。
Yiming Yang, Weipeng Hu, Haifeng Hu
― 1 分で読む
シーングラフを使ったAIの画像・動画生成を評価する新しい方法。
Ziqi Gao, Weikai Huang, Jieyu Zhang
― 1 分で読む
TextRefinerは、ビジョン・ランゲージモデルの性能を向上させて、より速くて正確にしてくれる。
Jingjing Xie, Yuxin Zhang, Jun Peng
― 1 分で読む
リアルデータを使って生成モデルのモデル崩壊を防ぐ方法を学ぼう。
Huminhao Zhu, Fangyikang Wang, Tianyu Ding
― 1 分で読む
視覚的錯覚がVQAモデルとそのパフォーマンスにどんな影響を与えるかを発見しよう。
Mohammadmostafa Rostamkhani, Baktash Ansari, Hoorieh Sabzevari
― 1 分で読む
AsyncDSBは、壊れた画像をクリエイティブに復元するための賢い方法を提供してるよ。
Zihao Han, Baoquan Zhang, Lisai Zhang
― 1 分で読む
軽量AIモデルが知識を効率的に保持する方法を学ぼう。
Jiaming Lv, Haoyuan Yang, Peihua Li
― 1 分で読む
画像と言葉をつなげて、よりスマートな機械を作る視覚言語モデルの仕組みを発見しよう。
Quang-Hung Le, Long Hoang Dang, Ngan Le
― 1 分で読む