Un cadre unifié pour des tâches de vision par ordinateur efficaces en utilisant un minimum de données.
Bharadwaj Ravichandran, Alexander Lynch, Sarah Brockman
― 9 min lire
La science de pointe expliquée simplement
Un cadre unifié pour des tâches de vision par ordinateur efficaces en utilisant un minimum de données.
Bharadwaj Ravichandran, Alexander Lynch, Sarah Brockman
― 9 min lire
Les modèles apprennent des objets anciens et nouveaux tout en se souvenir des connaissances passées.
Bowen Dong, Zitong Huang, Guanglei Yang
― 8 min lire
Watertox modifie astucieusement les images pour dérouter les systèmes IA tout en restant clair pour les humains.
Zhenghao Gao, Shengjie Xu, Meixi Chen
― 10 min lire
Explorer comment les systèmes récurrents peuvent améliorer les performances de segmentation d'images.
David Calhas, João Marques, Arlindo L. Oliveira
― 8 min lire
STTrack améliore le suivi d'objets en combinant plusieurs sources de données pour plus de précision.
Xiantao Hu, Ying Tai, Xu Zhao
― 9 min lire
NeSyCoCo améliore la capacité de l'IA à lier le langage et les visuels de manière efficace.
Danial Kamali, Elham J. Barezi, Parisa Kordjamshidi
― 9 min lire
Le modèle CICLD améliore la segmentation sémantique, comblant le fossé entre les images synthétiques et celles du monde réel.
Jongmin Yu, Zhongtian Sun, Shan Luo
― 11 min lire
Une nouvelle façon d'améliorer les ensembles d'images avec l'aide des gens.
Changjian Chen, Fei Lv, Yalong Guan
― 7 min lire
Un système révolutionnaire qui suit les animaux en temps réel à travers différents environnements.
Vincent Coulombe, David-Alexandre Roussel, Mohamad Sadegh Monfared
― 8 min lire
Des recherches montrent que les réseaux de convolution en profondeur gardent des filtres généraux d'une tâche à l'autre.
Zahra Babaiee, Peyman M. Kiasari, Daniela Rus
― 9 min lire
De nouvelles méthodes améliorent la reconnaissance d'objets sous différents temps grâce à des données synthétiques.
Javier Montalvo, Roberto Alcover-Couso, Pablo Carballeira
― 7 min lire
Découvre comment la technologie aide les chercheurs à suivre les oiseaux dans les aviaries.
Keon Moradi, Ethan Haque, Jasmeen Kaur
― 8 min lire
Une nouvelle méthode améliore la performance de la reconnaissance d'images grâce à une gestion intelligente des jetons.
Seungdong Yoa, Seungjun Lee, Hyeseung Cho
― 7 min lire
Apprends à améliorer la fiabilité des classificateurs d'images face aux distorsions.
Dang Nguyen, Sunil Gupta, Kien Do
― 8 min lire
Une nouvelle méthode qui accélère la formation en deep learning sans gros changements.
Evgeny Hershkovitch Neiterman, Gil Ben-Artzi
― 8 min lire
Découvre comment une simple photo peut créer un modèle de visage 3D détaillé.
Weijie Lyu, Yi Zhou, Ming-Hsuan Yang
― 8 min lire
Un nouveau système suit des objets en utilisant plusieurs vues et descriptions.
Sijia Chen, En Yu, Wenbing Tao
― 9 min lire
Une méthode révolutionnaire lie le langage à la reconnaissance de scènes 3D pour des machines plus intelligentes.
Hao Li, Roy Qin, Zhengyu Zou
― 7 min lire
Une approche en deux étapes s'occupe de la suppression des ombres dans les images, améliorant la reconnaissance des objets.
Jiamin Xu, Yuxin Zheng, Zelong Li
― 8 min lire
CoSurfGS propose une nouvelle approche pour la reconstruction 3D en utilisant le travail d'équipe entre les appareils.
Yuanyuan Gao, Yalun Dai, Hao Li
― 9 min lire
Une nouvelle méthode améliore le réalisme des scènes intérieures en 3D.
Zixi Liang, Guowei Xu, Haifeng Wu
― 8 min lire
Apprends comment l'incertitude influence la détection d'objets et le développement de modèles.
M. Tahasanul Ibrahim, Rifshu Hussain Shaik, Andreas Schwung
― 9 min lire
Apprends comment les modèles 3D améliorent l'estimation de l'orientation des objets pour les applis tech.
Zehan Wang, Ziang Zhang, Tianyu Pang
― 8 min lire
Les chercheurs appellent à un changement vers des évaluations multi-label dans la vision par ordinateur.
Esla Timothy Anzaku, Seyed Amir Mousavi, Arnout Van Messem
― 8 min lire
Découvre comment les modèles de langage visuel améliorent la compréhension des images et du texte.
Tenghui Li, Guoxu Zhou, Xuyang Zhao
― 9 min lire
Découvrez comment CDCTW améliore l'alignement des données pour différents domaines.
Afek Steinberg, Ran Eisenberg, Ofir Lindenbaum
― 6 min lire
Une nouvelle méthode s'attaque à l'imbalance de classe dans l'apprentissage continu multi-étiquette.
Yan Zhang, Guoqiang Wu, Bingzheng Wang
― 9 min lire
ArSyD décompose les images pour une meilleure compréhension et manipulation par les machines.
Alexandr Korchemnyi, Alexey K. Kovalev, Aleksandr I. Panov
― 8 min lire
Une nouvelle méthode améliore la façon dont on regroupe et analyse les images.
W. He, Z. Huang, X. Meng
― 6 min lire
Découvre comment les mécanismes d'attention améliorent l'apprentissage profond dans diverses applis.
Tianyu Ruan, Shihua Zhang
― 7 min lire
OMTSeg améliore la segmentation d'images en combinant vision et langage pour une meilleure reconnaissance d'objets.
Yi-Chia Chen, Wei-Hua Li, Chu-Song Chen
― 9 min lire
Un ensemble de données vise à améliorer l'identification des personnes à travers les cultures avec des vêtements modestes.
Alireza Sedighi Moghaddam, Fatemeh Anvari, Mohammadjavad Mirshekari Haghighi
― 9 min lire
Découvrez comment UNet s'attaque aux défis du traitement d'images tout en économisant de la mémoire.
Lingxiao Yin, Wei Tao, Dongyue Zhao
― 7 min lire
De nouvelles méthodes améliorent la reconnaissance d'actions grâce à l'analyse des données de squelette.
Yuheng Yang
― 11 min lire
Nouveau cadre améliore la compréhension des images, du texte et des objets 3D.
Siyu Jiao, Haoye Dong, Yuyang Yin
― 8 min lire
Enquête sur comment les changements de point de vue influencent la reconnaissance d'objets dans les modèles de vision.
Mateusz Michalkiewicz, Sheena Bai, Mahsa Baktashmotlagh
― 10 min lire
Une nouvelle méthode améliore la façon dont les ordis suivent des objets en utilisant des visuels et du texte.
X. Feng, D. Zhang, S. Hu
― 6 min lire
Comprends les défis et les outils pour une classification d'images précise.
Duy M. Le, Bao Q. Bui, Anh Tran
― 7 min lire
Une nouvelle méthode améliore la perception des véhicules pour une navigation autonome plus sûre.
Guanglei Yang, Yongqiang Zhang, Wanlong Li
― 7 min lire
GSplatLoc propose une localisation de caméra en temps réel super précise pour différentes technologies.
Atticus J. Zeller
― 10 min lire