Des chercheurs trouvent des moyens de réduire les inexactitudes dans les grands modèles de vision-langage.
Po-Hsuan Huang, Jeng-Lin Li, Chin-Po Chen
― 9 min lire
La science de pointe expliquée simplement
Des chercheurs trouvent des moyens de réduire les inexactitudes dans les grands modèles de vision-langage.
Po-Hsuan Huang, Jeng-Lin Li, Chin-Po Chen
― 9 min lire
GUESS reformule l'apprentissage auto-supervisé en intégrant l'incertitude pour des performances améliorées.
Salman Mohamadi, Gianfranco Doretto, Donald A. Adjeroh
― 9 min lire
TCDSG améliore l'analyse vidéo en suivant les relations entre les objets au fil du temps.
Raphael Ruschel, Md Awsafur Rahman, Hardik Prajapati
― 12 min lire
Découvrez comment la technologie des champs lumineux transforme l'estimation de la profondeur pour les robots et les véhicules autonomes.
Blanca Lasheras-Hernandez, Klaus H. Strobl, Sergio Izquierdo
― 9 min lire
L'estimation de profondeur amodale aide les machines à comprendre la profondeur des objets cachés.
Zhenyu Li, Mykola Lavreniuk, Jian Shi
― 8 min lire
Une nouvelle méthode pour enlever les ombres dans les images en utilisant des modèles génératifs avancés.
Xinjie Li, Yang Zhao, Dong Wang
― 7 min lire
ProbPose améliore la prédiction des points clés avec des probabilités calibrées et une détection de visibilité améliorée.
Miroslav Purkrabek, Jiri Matas
― 9 min lire
Explorer les défis que l'IA rencontre avec des images floues.
Ching-Yi Wang
― 8 min lire
De nouvelles méthodes améliorent la fusion des modèles tout en réduisant les interférences entre les tâches.
Antonio Andrea Gargiulo, Donato Crisostomi, Maria Sofia Bucarelli
― 8 min lire
Découvrez comment LL-ICM améliore la qualité des images tout en réduisant la taille des fichiers.
Yuan Xue, Qi Zhang, Chuanmin Jia
― 9 min lire
Une plongée profonde dans les techniques de segmentation des surfaces en vision par ordinateur.
Lukas Baumgärtner, Ronny Bergmann, Roland Herzog
― 8 min lire
Apprends comment les chercheurs créent des modèles 3D à partir d'images 2D en utilisant de nouvelles techniques.
Qitao Zhao, Shubham Tulsiani
― 7 min lire
Découvrez comment NODE-AdvGAN trompe l'IA avec des images subtiles.
Xinheng Xie, Yue Wu, Cuiyu He
― 8 min lire
Des chercheurs s'attaquent aux problèmes de rolling shutter dans les images en champ lumineux pour des photos plus nettes.
Hermes McGriff, Renato Martins, Nicolas Andreff
― 7 min lire
Examiner les effets de l'entraînement multimodal sur les compétences linguistiques en IA.
Neale Ratzlaff, Man Luo, Xin Su
― 10 min lire
Apprends comment les MLVGMs aident à protéger les systèmes de vision par ordinateur contre les attaques adversariales.
Dario Serez, Marco Cristani, Alessio Del Bue
― 9 min lire
Découvrez le monde fascinant des variétés de cactus en géométrie algébrique.
Weronika Buczyńska, Jarosław Buczyński, Łucja Farnik
― 7 min lire
Une nouvelle méthode améliore la génération d'images en utilisant des squelettes numériques.
Aron Fóthi, Bence Fazekas, Natabara Máté Gyöngyössy
― 5 min lire
Découvre comment la vision basée sur des événements change la capture de données en vision par ordinateur.
Jens Egholm Pedersen, Dimitris Korakovounis, Jörg Conradt
― 7 min lire
Une avancée dans la technologie de navigation utilisant plusieurs caméras pour un meilleur positionnement.
Huai Yu, Junhao Wang, Yao He
― 8 min lire
Adapter CLIP pour gérer la modalité événementielle ouvre de nouvelles perspectives pour l'apprentissage machine.
Sungheon Jeong, Hanning Chen, Sanggeon Yun
― 10 min lire
Align3R garantit une estimation de profondeur précise dans les vidéos dynamiques avec une cohérence améliorée.
Jiahao Lu, Tianyu Huang, Peng Li
― 10 min lire
TokenFlow fusionne compréhension et création d'images pour des capacités IA avancées.
Liao Qu, Huichao Zhang, Yiheng Liu
― 7 min lire
Révolutionner l'analyse des données 3D avec une approche non paramétrique.
Marzieh Mohammadi, Amir Salarpour
― 8 min lire
De nouvelles méthodes améliorent la détection d'actions rares dans les vidéos en utilisant des approches innovantes.
Xiaofeng Tan, Hongsong Wang, Xin Geng
― 7 min lire
Une nouvelle façon d'améliorer la compréhension d'image par les machines inspirée de la vision humaine.
Jorge Vila-Tomás, Pablo Hernández-Cámara, Valero Laparra
― 6 min lire
Découvre comment les méthodes non supervisées améliorent l'analyse d'images sans exemples étiquetés.
Daniela Ivanova, Marco Aversa, Paul Henderson
― 9 min lire
Des recherches montrent comment les modèles de vision et de langage peuvent mieux fonctionner ensemble.
Le Zhang, Qian Yang, Aishwarya Agrawal
― 8 min lire
Une méthode révolutionnaire améliore l'apprentissage automatique grâce à une approche adaptative des symétries.
Putri A. van der Linden, Alejandro García-Castellanos, Sharvaree Vadgama
― 7 min lire
Florence-2 et DBFusion redéfinissent comment les machines interprètent les images et le texte.
Jiuhai Chen, Jianwei Yang, Haiping Wu
― 9 min lire
Une nouvelle méthode améliore la détection des contours malgré les défis du bruit.
Dhruv Kohli, Jesse He, Chester Holtz
― 7 min lire
Découvre les dernières méthodes pour améliorer la détection d'objets pour les robots.
Alan Li, Angela P. Schoellig
― 10 min lire
Découvrez comment les modèles d'IA s'adaptent à des environnements variés avec la Généralisation de Domaine et SoRA.
Seokju Yun, Seunghye Chae, Dongheon Lee
― 9 min lire
Un nouveau jeu de données améliore la façon dont les modèles perçoivent la couleur et le contexte.
Ming-Chang Chiu, Shicheng Wen, Pin-Yu Chen
― 9 min lire
Explore la montée des données synthétiques dans l'apprentissage automatique et son impact significatif.
Abdulrahman Kerim, Leandro Soriano Marcolino, Erickson R. Nascimento
― 7 min lire
De nouvelles recherches montrent comment des caractéristiques partagées peuvent prédire les vulnérabilités des modèles d'IA.
Ashley S. Dale, Mei Qiu, Foo Bin Che
― 9 min lire
Découvrez comment la détection d'objets identifie et localise différents éléments dans les images.
Fnu Neha, Deepshikha Bhati, Deepak Kumar Shukla
― 7 min lire
Révolutionner la façon dont on détecte et suit des objets dans les vidéos.
Khurram Azeem Hashmi, Talha Uddin Sheikh, Didier Stricker
― 8 min lire
Découvre comment une approche hybride améliore les modèles de machine learning avec des labels bruyants.
Gouranga Bala, Anuj Gupta, Subrat Kumar Behera
― 8 min lire
Des chercheurs améliorent les méthodes d'imagerie 3D pour une meilleure perception de la profondeur grâce à des techniques de formation innovantes.
Alex Rich, Noah Stier, Pradeep Sen
― 10 min lire