Découvre comment le biais de texture influence les décisions de l'IA et la reconnaissance d'objets.
Blaine Hoak, Ryan Sheatsley, Patrick McDaniel
― 7 min lire
New Science Research Articles Everyday
Découvre comment le biais de texture influence les décisions de l'IA et la reconnaissance d'objets.
Blaine Hoak, Ryan Sheatsley, Patrick McDaniel
― 7 min lire
Derniers articles
Sara Ghazanfari, Siddharth Garg, Nicolas Flammarion
― 8 min lire
Yiwen Gu, Mahir Patel, Margrit Betke
― 6 min lire
Umar Khalid, Hasan Iqbal, Azib Farooq
― 9 min lire
Yufan Zhou, Ruiyi Zhang, Jiuxiang Gu
― 7 min lire
Joshua Adrian Cahyono, Jeremy Nathan Jusuf
― 8 min lire
Découvrez comment les appareils mobiles transforment la création de vidéos pour tout le monde.
Yushu Wu, Zhixing Zhang, Yanyu Li
― 7 min lire
Les nouvelles technologies améliorent l'analyse d'images pour un meilleur diagnostic des maladies.
Zhenfeng Zhuang, Min Cen, Yanfeng Li
― 8 min lire
Un nouveau jeu de données révolutionne l'analyse des images médicales et de leurs descriptions.
Muhammad Uzair Khattak, Shahina Kunhimon, Muzammal Naseer
― 10 min lire
Découvre comment les classes de mots façonnent notre communication et notre sens.
Coleman Haley, Sharon Goldwater, Edoardo Ponti
― 9 min lire
OP-LoRA améliore les modèles d'IA pour des tâches spécifiques, augmentant l'efficacité et la performance.
Piotr Teterwak, Kate Saenko, Bryan A. Plummer
― 7 min lire
Déballer les éléments clés qui font avancer la compréhension vidéo dans les grands modèles multimodaux.
Orr Zohar, Xiaohan Wang, Yann Dubois
― 9 min lire
Une nouvelle méthode améliore la fusion d'images pour plus de détails et de clarté.
Ferhat Can Ataman, Gözde Bozdaği Akar
― 8 min lire
Un nouveau modèle améliore la précision de la mesure de la hauteur de la canopée pour une meilleure gestion des forêts.
Tony Chang, Kiarie Ndegwa, Andreas Gros
― 9 min lire
AlignCap améliore les descriptions d'images, permettant aux machines de communiquer les détails visuels efficacement.
Yuan Sun, Zhao Zhang, Jorge Ortiz
― 7 min lire
DeepSeek-VL2 fusionne les données visuelles et textuelles pour des interactions AI plus intelligentes.
Zhiyu Wu, Xiaokang Chen, Zizheng Pan
― 6 min lire
De nouvelles méthodes en reconstruction 3D donnent vie à des applications concrètes.
Manuel Dahnert, Angela Dai, Norman Müller
― 6 min lire
Découvre comment la segmentation guidée par des prompts change la technologie de reconnaissance d'images.
Yu-Jhe Li, Xinyang Zhang, Kun Wan
― 9 min lire
UnPIC transforme des images 2D en super représentations 3D sans effort.
Rishabh Kabra, Drew A. Hudson, Sjoerd van Steenkiste
― 9 min lire
SuperGSeg apporte de la clarté aux scènes 3D complexes grâce à des techniques de segmentation avancées.
Siyun Liang, Sen Wang, Kunyi Li
― 7 min lire
La technologie de montage avancée donne vie à des images réalistes.
Nikolai Warner, Jack Kolb, Meera Hahn
― 9 min lire
Explore le monde fascinant des avatars 3D réalistes de têtes à partir de vidéos.
Jiapeng Tang, Davide Davoli, Tobias Kirschstein
― 9 min lire
L'encodage multi-tête rend la classification avec plein d'étiquettes plus facile à gérer.
Daojun Liang, Haixia Zhang, Dongfeng Yuan
― 7 min lire
Découvrez comment la technologie d'essayage vidéo change notre façon de faire du shopping pour des vêtements.
Hung Nguyen, Quang Qui-Vinh Nguyen, Khoi Nguyen
― 7 min lire
Découvrez comment WordVIS simplifie la classification des documents avec des couleurs.
Umar Khan, Saifullah, Stefan Agne
― 6 min lire
Découvre les avancées pour améliorer la photo en basse lumière et la qualité d'image.
Igor Morawski, Kai He, Shusil Dangi
― 11 min lire
Un nouveau test pour que les machines répondent à des questions sur des images et du texte.
Hyeonseok Lim, Dongjae Shin, Seohyun Song
― 9 min lire
Découvrez comment les illusions visuelles bercent notre perception et impactent notre vie quotidienne.
Alex Gomez-Villa, Kai Wang, Alejandro C. Parraga
― 9 min lire
Des chercheurs ont développé une méthode pour réduire les artefacts de mouvement dans les IRM.
Jiahua Xu, Dawei Zhou, Lei Hu
― 6 min lire
Découvre une méthode rapide pour créer des modèles 3D détaillés.
Briac Toussaint, Diego Thomas, Jean-Sébastien Franco
― 7 min lire
ManipGPT simplifie les tâches robotiques, permettant une interaction plus intelligente avec les objets.
Taewhan Kim, Hojin Bae, Zeming Li
― 8 min lire
Découvrez comment les nouvelles méthodes de filigrane protègent tes images en ligne.
Runyi Hu, Jie Zhang, Yiming Li
― 6 min lire
L'apprentissage profond offre un nouvel espoir pour diagnostiquer l'arthrose du genou de manière efficace.
Nicharee Srikijkasemwat, Soumya Snigdha Kundu, Fuping Wu
― 8 min lire
De nouvelles méthodes améliorent le marquage d'images pour de meilleures performances et une meilleure efficacité du modèle.
Niclas Popp, Dan Zhang, Jan Hendrik Metzen
― 9 min lire
Apprends comment les fonctions de distance influencent notre perception de l'espace et améliorent la technologie.
Alexander Belyaev, Pierre-Alain Fayolle
― 7 min lire
Découvre comment les machines améliorent leur compréhension des images et des textes.
Yeyuan Wang, Dehong Gao, Lei Yi
― 8 min lire
waveOrder permet aux scientifiques d'étudier les cellules sans les perturber grâce à une imagerie innovante.
Talon Chandler, Eduardo Hirata-Miyasaki, Ivan E. Ivanov
― 8 min lire
Découvrez comment l'IA peut transformer le design sonore dans les vidéos et les jeux.
Sudha Krishnamurthy
― 7 min lire
Transformez des vidéos d'une seule caméra en points de vue dynamiques sans effort.
Jongmin Park, Minh-Quan Viet Bui, Juan Luis Gonzalez Bello
― 7 min lire
Une nouvelle méthode améliore la distillation des datasets pour une reconnaissance d'images efficace.
Xinhao Zhong, Shuoyang Sun, Xulin Gu
― 7 min lire
Une nouvelle méthode pour créer des ensembles de données synthétiques efficaces pour les modèles de deep learning.
Xinhao Zhong, Bin Chen, Hao Fang
― 9 min lire
Découvre comment la technologie Lidar améliore tes photos et réduit le flou.
Ziyao Yi, Diego Valsesia, Tiziano Bianchi
― 8 min lire
Transforme tes repas en infos calories avec une simple photo.
Dongyu Yao, Keling Yao, Junhong Zhou
― 9 min lire
Un nouveau modèle change la façon dont on analyse le contenu vidéo de manière efficace.
Zhuqiang Lu, Zhenfei Yin, Mengwei He
― 7 min lire
Une nouvelle méthode améliore la création d'images adversariales en imagerie médicale.
Yasamin Medghalchi, Moein Heidari, Clayton Allard
― 8 min lire
Un nouveau cadre améliore comment on traite les longues vidéos de manière efficace.
Sosuke Yamao, Natsuki Miyahara, Yuki Harazono
― 8 min lire
Découvrez comment STDD améliore la reconnaissance d'actions dans les vidéos.
Yating Yu, Congqi Cao, Yueran Zhang
― 6 min lire
VQTalker crée des avatars parlants réalistes dans plusieurs langues, améliorant les interactions digitales.
Tao Liu, Ziyang Ma, Qi Chen
― 8 min lire
Explorer comment les étudiants peuvent apprendre mieux que leurs profs en intelligence artificielle.
Jianhua Zhang, Yi Gao, Ruyu Liu
― 7 min lire
Des chercheurs découvrent comment l'IA imite la vision humaine grâce aux réseaux de neurones convolutifs.
Yudi Xie, Weichen Huang, Esther Alter
― 8 min lire
Une nouvelle méthode améliore la précision de l'OCR pour les langues sous-représentées.
Harshvivek Kashid, Pushpak Bhattacharyya
― 10 min lire
Découvre comment VehiclePaliGemma transforme la technologie de lecture des plaques d'immatriculation.
Nouar AlDahoul, Myles Joshua Toledo Tan, Raghava Reddy Tera
― 9 min lire
Une nouvelle méthode utilise des scans 3D pour prédire les visages après une chirurgie.
Huijun Han, Congyi Zhang, Lifeng Zhu
― 9 min lire
Découvrez comment AURORA simplifie le design d'intérieur virtuel pour les pros et les passionnés.
Huijun Han, Yongqing Liang, Yuanlong Zhou
― 9 min lire
Transforme des demandes simples en descriptions d'images vibrantes avec CapAgent.
Xinran Wang, Muxi Diao, Baoteng Li
― 7 min lire
Découvrez comment les modèles génératifs créent de nouvelles données avec des approches uniques.
Zeeshan Patel, James DeLoye, Lance Mathias
― 9 min lire
De nouvelles méthodes améliorent la détection des défauts dans l'imagerie industrielle.
Alejandro Garnung Menéndez
― 8 min lire
RapidNet améliore la vitesse et la précision du traitement des images sur mobile.
Mustafa Munir, Md Mostafijur Rahman, Radu Marculescu
― 8 min lire
Analyser la voix peut révéler des signes de dépression et permettre une intervention précoce.
Quang-Anh N. D., Manh-Hung Ha, Thai Kim Dinh
― 7 min lire
Découvre comment la segmentation 3D aide les robots à reconnaître et étiqueter des objets dans des environnements complexes.
Luis Wiedmann, Luca Wiehe, David Rozenberszki
― 7 min lire
Découvrez comment SoftVQ-VAE améliore la création d'images avec efficacité et qualité.
Hao Chen, Ze Wang, Xiang Li
― 7 min lire
Une nouvelle méthode enlève efficacement les reflets des images en utilisant des techniques avancées.
Abdelrahman Elnenaey, Marwan Torki
― 9 min lire
SegHeD+ améliore la précision pour identifier les lésions de la sclérose en plaques.
Berke Doga Basaran, Paul M. Matthews, Wenjia Bai
― 6 min lire
Des chercheurs bossent pour rendre les explications de l'IA plus claires et plus fiables.
Miquel Miró-Nicolau, Antoni Jaume-i-Capó, Gabriel Moyà-Alcover
― 8 min lire
Apprends comment les machines interprètent les vidéos, des clips amusants aux applications essentielles.
Katrina Drozdov, Ravid Shwartz-Ziv, Yann LeCun
― 8 min lire
HGT-Track combine des caméras visibles et thermiques pour suivre efficacement les petits objets.
Qingyu Xu, Longguang Wang, Weidong Sheng
― 5 min lire
Le cadre SEW révolutionne l'analyse d'images en pathologie pour un meilleur traitement du cancer.
Haoming Luo, Xiaotian Yu, Shengxuming Zhang
― 7 min lire
Les systèmes d'IA améliorent leur compréhension des interfaces graphiques pour offrir de meilleures expériences utilisateur.
Hai-Ming Xu, Qi Chen, Lei Wang
― 9 min lire
Découvrez comment la technologie prédit les traits de famille grâce à la génération d'images de haute qualité.
Pin-Yen Chiu, Dai-Jie Wu, Po-Hsun Chu
― 7 min lire
Découvrez comment l'apprentissage contextuel transforme la création vidéo.
Zhengcong Fei, Di Qiu, Changqian Yu
― 8 min lire
Une nouvelle approche améliore la précision et l'efficacité des réponses aux questions audio-visuelles.
Zhangbin Li, Jinxing Zhou, Jing Zhang
― 8 min lire
Découvrez comment les données partagées rendent la conduite autonome plus sûre et plus intelligente.
Jingyu Zhang, Yilei Wang, Lang Qian
― 8 min lire
Un nouveau cadre pour créer des vidéos et des images rapidement.
Cong Wan, Xiangyang Luo, Zijian Cai
― 7 min lire
Une nouvelle méthode améliore l'identification des personnes en utilisant les infos des images voisines.
Xiao Teng, Long Lan, Dingyao Chen
― 10 min lire
Nouveau jeu de données permet de mieux comparer les algorithmes de reconstruction CT.
Maximilian B. Kiss, Ander Biguri, Zakhar Shumaylov
― 9 min lire
Une nouvelle méthode améliore la détection des régions de tissu anormales dans la recherche médicale.
Kaichen Xu, Qilong Wu, Yan Lu
― 5 min lire
Un nouveau système aide à surveiller et améliorer les habitudes de position assise pour une meilleure santé.
Hang Jin, Xin He, Lingyun Wang
― 8 min lire
Une nouvelle méthode améliore l'apprentissage automatique sans les données originales.
Yingping Liang, Ying Fu
― 8 min lire
Une nouvelle approche permet d'éliminer les flares gênants dans les images en utilisant plusieurs angles de vue.
Gopi Raju Matta, Rahul Siddartha, Rongali Simhachala Venkata Girish
― 9 min lire
Révolutionne ton expérience vidéo avec des techniques d'interpolation de frame à la pointe de la technologie.
Wonyong Seo, Jihyong Oh, Munchurl Kim
― 5 min lire
Les robots apprennent maintenant des tâches en regardant les humains, ce qui améliore la collaboration dans plusieurs secteurs.
Ehsan Asali, Prashant Doshi
― 11 min lire
Explore comment les transformations d'images affectent notre perception des visuels.
Paula Daudén-Oliver, David Agost-Beltran, Emilio Sansano-Sansano
― 10 min lire
Un nouveau modèle crée des polices pour des langues diverses, en s'attaquant aux défis de design de manière efficace.
Zhiheng Wang, Jiarui Liu
― 8 min lire
Un nouveau cadre améliore l'alignement des sons et des visuels dans les vidéos.
Kexin Li, Zongxin Yang, Yi Yang
― 8 min lire
De nouvelles méthodes permettent aux machines de lire les émotions en VR grâce aux expressions faciales.
Thorben Ortmann, Qi Wang, Larissa Putzar
― 10 min lire
Des chercheurs ont développé une nouvelle méthode pour améliorer le suivi de mouvement en utilisant l'estimation du flux normal.
Dehao Yuan, Levi Burner, Jiayi Wu
― 7 min lire