Des recherches montrent que les réseaux de convolution en profondeur gardent des filtres généraux d'une tâche à l'autre.
Zahra Babaiee, Peyman M. Kiasari, Daniela Rus
― 9 min lire
La science de pointe expliquée simplement
Des recherches montrent que les réseaux de convolution en profondeur gardent des filtres généraux d'une tâche à l'autre.
Zahra Babaiee, Peyman M. Kiasari, Daniela Rus
― 9 min lire
De nouvelles méthodes améliorent la reconnaissance d'objets sous différents temps grâce à des données synthétiques.
Javier Montalvo, Roberto Alcover-Couso, Pablo Carballeira
― 7 min lire
Découvre comment la technologie aide les chercheurs à suivre les oiseaux dans les aviaries.
Keon Moradi, Ethan Haque, Jasmeen Kaur
― 8 min lire
Une nouvelle méthode améliore la performance de la reconnaissance d'images grâce à une gestion intelligente des jetons.
Seungdong Yoa, Seungjun Lee, Hyeseung Cho
― 7 min lire
Apprends à améliorer la fiabilité des classificateurs d'images face aux distorsions.
Dang Nguyen, Sunil Gupta, Kien Do
― 8 min lire
Une nouvelle méthode qui accélère la formation en deep learning sans gros changements.
Evgeny Hershkovitch Neiterman, Gil Ben-Artzi
― 8 min lire
Découvre comment une simple photo peut créer un modèle de visage 3D détaillé.
Weijie Lyu, Yi Zhou, Ming-Hsuan Yang
― 8 min lire
Un nouveau système suit des objets en utilisant plusieurs vues et descriptions.
Sijia Chen, En Yu, Wenbing Tao
― 9 min lire
Une méthode révolutionnaire lie le langage à la reconnaissance de scènes 3D pour des machines plus intelligentes.
Hao Li, Roy Qin, Zhengyu Zou
― 7 min lire
Une approche en deux étapes s'occupe de la suppression des ombres dans les images, améliorant la reconnaissance des objets.
Jiamin Xu, Yuxin Zheng, Zelong Li
― 8 min lire
CoSurfGS propose une nouvelle approche pour la reconstruction 3D en utilisant le travail d'équipe entre les appareils.
Yuanyuan Gao, Yalun Dai, Hao Li
― 9 min lire
Une nouvelle méthode améliore le réalisme des scènes intérieures en 3D.
Zixi Liang, Guowei Xu, Haifeng Wu
― 8 min lire
Apprends comment l'incertitude influence la détection d'objets et le développement de modèles.
M. Tahasanul Ibrahim, Rifshu Hussain Shaik, Andreas Schwung
― 9 min lire
Apprends comment les modèles 3D améliorent l'estimation de l'orientation des objets pour les applis tech.
Zehan Wang, Ziang Zhang, Tianyu Pang
― 8 min lire
Les chercheurs appellent à un changement vers des évaluations multi-label dans la vision par ordinateur.
Esla Timothy Anzaku, Seyed Amir Mousavi, Arnout Van Messem
― 8 min lire
Découvre comment les modèles de langage visuel améliorent la compréhension des images et du texte.
Tenghui Li, Guoxu Zhou, Xuyang Zhao
― 9 min lire
Découvrez comment CDCTW améliore l'alignement des données pour différents domaines.
Afek Steinberg, Ran Eisenberg, Ofir Lindenbaum
― 6 min lire
Une nouvelle méthode s'attaque à l'imbalance de classe dans l'apprentissage continu multi-étiquette.
Yan Zhang, Guoqiang Wu, Bingzheng Wang
― 9 min lire
ArSyD décompose les images pour une meilleure compréhension et manipulation par les machines.
Alexandr Korchemnyi, Alexey K. Kovalev, Aleksandr I. Panov
― 8 min lire
Une nouvelle méthode améliore la façon dont on regroupe et analyse les images.
W. He, Z. Huang, X. Meng
― 6 min lire
Découvre comment les mécanismes d'attention améliorent l'apprentissage profond dans diverses applis.
Tianyu Ruan, Shihua Zhang
― 7 min lire
OMTSeg améliore la segmentation d'images en combinant vision et langage pour une meilleure reconnaissance d'objets.
Yi-Chia Chen, Wei-Hua Li, Chu-Song Chen
― 9 min lire
Un ensemble de données vise à améliorer l'identification des personnes à travers les cultures avec des vêtements modestes.
Alireza Sedighi Moghaddam, Fatemeh Anvari, Mohammadjavad Mirshekari Haghighi
― 9 min lire
Découvrez comment UNet s'attaque aux défis du traitement d'images tout en économisant de la mémoire.
Lingxiao Yin, Wei Tao, Dongyue Zhao
― 7 min lire
De nouvelles méthodes améliorent la reconnaissance d'actions grâce à l'analyse des données de squelette.
Yuheng Yang
― 11 min lire
Nouveau cadre améliore la compréhension des images, du texte et des objets 3D.
Siyu Jiao, Haoye Dong, Yuyang Yin
― 8 min lire
Enquête sur comment les changements de point de vue influencent la reconnaissance d'objets dans les modèles de vision.
Mateusz Michalkiewicz, Sheena Bai, Mahsa Baktashmotlagh
― 10 min lire
Une nouvelle méthode améliore la façon dont les ordis suivent des objets en utilisant des visuels et du texte.
X. Feng, D. Zhang, S. Hu
― 6 min lire
Comprends les défis et les outils pour une classification d'images précise.
Duy M. Le, Bao Q. Bui, Anh Tran
― 7 min lire
Une nouvelle méthode améliore la perception des véhicules pour une navigation autonome plus sûre.
Guanglei Yang, Yongqiang Zhang, Wanlong Li
― 7 min lire
GSplatLoc propose une localisation de caméra en temps réel super précise pour différentes technologies.
Atticus J. Zeller
― 10 min lire
Découvrez comment SimLTD améliore la détection d'objets rares dans les images.
Phi Vu Tran
― 7 min lire
CA-DPS apporte un nouvel espoir pour résoudre les problèmes inverses en imagerie.
Shayan Mohajer Hamidi, En-Hui Yang
― 8 min lire
Le dataset DAVE capture des scénarios de route complexes pour un meilleur entraînement de l'IA.
Xijun Wang, Pedro Sandoval-Segura, Chengyuan Zhang
― 10 min lire
Une méthode révolutionnaire pour identifier des objets connus et inconnus en temps réel.
Lihao Liu, Juexiao Feng, Hui Chen
― 8 min lire
Les LVLMs ont du mal à reconnaître la réalité, ce qui peut avoir des conséquences graves.
Ashish Seth, Dinesh Manocha, Chirag Agarwal
― 6 min lire
Découvre comment l'enregistrement de nuages de points aide les robots à comprendre leur environnement.
Ziyuan Qin, Jongseok Lee, Rudolph Triebel
― 8 min lire
MetricDepth améliore l'estimation de la profondeur à partir d'images uniques en utilisant l'apprentissage métrique profond.
Chunpu Liu, Guanglei Yang, Wangmeng Zuo
― 7 min lire
Les avancées en IA améliorent les capacités de réponse aux questions visuelles.
Junxiao Xue, Quan Deng, Fei Yu
― 8 min lire
Une nouvelle méthode améliore la détection d'objets dans les voitures autonomes en utilisant des données de caméra et de LiDAR.
Fardin Ayar, Ehsan Javanmardi, Manabu Tsukada
― 8 min lire