ModPrompt aide les détecteurs d'objets à s'adapter efficacement à de nouvelles images.
Heitor R. Medeiros, Atif Belal, Srikanth Muralidharan
― 7 min lire
La science de pointe expliquée simplement
ModPrompt aide les détecteurs d'objets à s'adapter efficacement à de nouvelles images.
Heitor R. Medeiros, Atif Belal, Srikanth Muralidharan
― 7 min lire
De nouvelles méthodes améliorent la performance et l'efficacité des grands modèles de langage multimodaux.
Shiyu Zhao, Zhenting Wang, Felix Juefei-Xu
― 7 min lire
Découvrez comment de nouvelles méthodes améliorent la reconnaissance des petits objets dans les données 3D.
Chade Li, Pengju Zhang, Yihong Wu
― 8 min lire
LineGS améliore la précision et l'efficacité des scènes 3D grâce à des segments de ligne avancés.
Chenggang Yang, Yuang Shi
― 7 min lire
Des chercheurs ont développé un système adaptatif pour estimer les formes et positions des objets à partir d'images.
Jingnan Shi, Rajat Talak, Harry Zhang
― 7 min lire
Découvrez comment les CNN doubles économisent de l'énergie tout en améliorant la reconnaissance d'images.
Michail Kinnas, John Violos, Ioannis Kompatsiaris
― 6 min lire
Des scientifiques trouvent des moyens de reconstruire des images avec des concepts effacés en utilisant des techniques avancées.
Matan Rusanovsky, Shimon Malnick, Amir Jevnisek
― 7 min lire
Explorer comment les caractéristiques des données affectent la performance de l'apprentissage auto-supervisé.
Raynor Kirkson E. Chavez, Kyle Gabriel M. Reynoso
― 7 min lire
Apprends comment le cadre POBF transforme la reconnaissance d'images avec peu de données.
Zilin Du, Haoxin Li, Jianfei Yu
― 9 min lire
De nouvelles techniques améliorent la précision dans la détection de l'orientation de la tête en utilisant des images synthétiques.
Ting-Ruen Wei, Haowei Liu, Huei-Chung Hu
― 9 min lire
Une nouvelle méthode réduit la surcharge de requêtes dans les modèles de détection 3D.
Lizhen Xu, Shanmin Pang, Wenzhao Qiu
― 7 min lire
Apprends comment des modèles plus petits transforment la reconstruction 3D à partir d'images.
Aditya Dutt, Ishikaa Lunawat, Manpreet Kaur
― 8 min lire
Une nouvelle méthode trouve des objets dans de longues vidéos sans avoir besoin d'un entraînement intensif.
Savya Khosla, Sethuraman T, Alexander Schwing
― 9 min lire
Une nouvelle méthode fusionne les données visuelles et le langage pour une compréhension 3D plus intelligente.
Jiahuan Cheng, Jan-Nico Zaech, Luc Van Gool
― 10 min lire
Découvrez comment DETR transforme la détection d'objets et améliore la fiabilité des prédictions.
Young-Jin Park, Carson Sobolewski, Navid Azizan
― 10 min lire
Révolutionner l'apprentissage automatique avec des variations d'images auto-générées.
Varun Belagali, Srikar Yellapragada, Alexandros Graikos
― 8 min lire
Cette méthode améliore la façon dont les ordis trouvent et suivent les gens dans les images.
Miroslav Purkrabek, Jiri Matas
― 5 min lire
Les chercheurs utilisent des données synthétiques et de l'IA explicable pour améliorer les modèles de détection d'objets.
Nitish Mital, Simon Malzard, Richard Walters
― 6 min lire
Un nouveau jeu de données qui améliore la précision du suivi d'objets vidéo.
Sangbeom Lim, Seongchan Kim, Seungjun An
― 7 min lire
Faire le pont entre images et données 3D pour une détection de localisation précise.
Qiyuan Shen, Hengwang Zhao, Weihao Yan
― 8 min lire
Une nouvelle méthode pour améliorer l'apprentissage dans les modèles vision-langage qui gèrent des données bruyantes.
Bikang Pan, Qun Li, Xiaoying Tang
― 9 min lire
Une nouvelle méthode améliore les modèles 3D des mouvements des animaux en utilisant des données limitées.
Christopher Fusco, Mosam Dabhi, Shin-Fang Ch'ng
― 9 min lire
Apprends à propos de la segmentation d'image, ses techniques, et l'importance de l'incertitude dans l'analyse.
M. M. A. Valiuddin, R. J. G. van Sloun, C. G. A. Viviers
― 10 min lire
Des chercheurs trouvent des moyens de réduire les inexactitudes dans les grands modèles de vision-langage.
Po-Hsuan Huang, Jeng-Lin Li, Chin-Po Chen
― 9 min lire
GUESS reformule l'apprentissage auto-supervisé en intégrant l'incertitude pour des performances améliorées.
Salman Mohamadi, Gianfranco Doretto, Donald A. Adjeroh
― 9 min lire
TCDSG améliore l'analyse vidéo en suivant les relations entre les objets au fil du temps.
Raphael Ruschel, Md Awsafur Rahman, Hardik Prajapati
― 12 min lire
Découvrez comment la technologie des champs lumineux transforme l'estimation de la profondeur pour les robots et les véhicules autonomes.
Blanca Lasheras-Hernandez, Klaus H. Strobl, Sergio Izquierdo
― 9 min lire
L'estimation de profondeur amodale aide les machines à comprendre la profondeur des objets cachés.
Zhenyu Li, Mykola Lavreniuk, Jian Shi
― 8 min lire
Une nouvelle méthode pour enlever les ombres dans les images en utilisant des modèles génératifs avancés.
Xinjie Li, Yang Zhao, Dong Wang
― 7 min lire
ProbPose améliore la prédiction des points clés avec des probabilités calibrées et une détection de visibilité améliorée.
Miroslav Purkrabek, Jiri Matas
― 9 min lire
Explorer les défis que l'IA rencontre avec des images floues.
Ching-Yi Wang
― 8 min lire
De nouvelles méthodes améliorent la fusion des modèles tout en réduisant les interférences entre les tâches.
Antonio Andrea Gargiulo, Donato Crisostomi, Maria Sofia Bucarelli
― 8 min lire
Découvrez comment LL-ICM améliore la qualité des images tout en réduisant la taille des fichiers.
Yuan Xue, Qi Zhang, Chuanmin Jia
― 9 min lire
Une plongée profonde dans les techniques de segmentation des surfaces en vision par ordinateur.
Lukas Baumgärtner, Ronny Bergmann, Roland Herzog
― 8 min lire
Apprends comment les chercheurs créent des modèles 3D à partir d'images 2D en utilisant de nouvelles techniques.
Qitao Zhao, Shubham Tulsiani
― 7 min lire
Découvrez comment NODE-AdvGAN trompe l'IA avec des images subtiles.
Xinheng Xie, Yue Wu, Cuiyu He
― 8 min lire
Des chercheurs s'attaquent aux problèmes de rolling shutter dans les images en champ lumineux pour des photos plus nettes.
Hermes McGriff, Renato Martins, Nicolas Andreff
― 7 min lire
Examiner les effets de l'entraînement multimodal sur les compétences linguistiques en IA.
Neale Ratzlaff, Man Luo, Xin Su
― 10 min lire
Apprends comment les MLVGMs aident à protéger les systèmes de vision par ordinateur contre les attaques adversariales.
Dario Serez, Marco Cristani, Alessio Del Bue
― 9 min lire
Découvrez le monde fascinant des variétés de cactus en géométrie algébrique.
Weronika Buczyńska, Jarosław Buczyński, Łucja Farnik
― 7 min lire