Une nouvelle méthode s'attaque à la diversité et à la qualité des images générées.
Rohit Jena, Ali Taghibakhshi, Sahil Jain
― 7 min lire
La science de pointe expliquée simplement
Une nouvelle méthode s'attaque à la diversité et à la qualité des images générées.
Rohit Jena, Ali Taghibakhshi, Sahil Jain
― 7 min lire
Derniers articles
Cameron Dennis Pain, Yasmeen George, Alex Fornito
― 7 min lire
Tao Ni, Xin Zhan, Tao Luo
― 8 min lire
Pratibha Kumari, Daniel Reisenbüchler, Lucas Luttner
― 7 min lire
Nischal Khanal, Shivanand Venkanna Sheshappanavar
― 8 min lire
Fangzhou Lin, Haotian Liu, Haoying Zhou
― 8 min lire
RPP améliore l'ajustement et la généralisation dans les modèles Vision-Language en utilisant des prompts affinés.
Zhenyuan Chen, Lingfeng Yang, Shuo Chen
― 9 min lire
Explorer des méthodes pour améliorer la qualité des images affectées par la turbulence atmosphérique.
Paul Hill, Nantheera Anantrasirichai, Alin Achim
― 8 min lire
Combiner des images RGB et des données d'événements améliore la clarté des reconstructions 3D.
Wei Zhi Tang, Daniel Rebain, Kostantinos G. Derpanis
― 9 min lire
DiffusionPen génère un texte manuscrit réaliste en capturant des styles d'écriture uniques.
Konstantina Nikolaidou, George Retsinas, Giorgos Sfikas
― 8 min lire
Une nouvelle méthode améliore la reconstruction 3D à partir de vidéos endoscopiques pour des applications chirurgicales.
Michel Hayoz, Christopher Hahne, Thomas Kurmann
― 8 min lire
Cette méthode améliore les jeux de données d'entraînement pour une meilleure performance en segmentation d'images.
Quang-Huy Che, Duc-Tri Le, Vinh-Tiep Nguyen
― 8 min lire
Une nouvelle méthode pour améliorer la recréation de scènes 3D à partir d'images avec moins d'erreurs.
Benjamin Attal, Dor Verbin, Ben Mildenhall
― 6 min lire
Une nouvelle méthode améliore l'efficacité de la planification de mouvement des robots en utilisant des simulations et des données d'experts.
Murtaza Dalal, Jiahui Yang, Russell Mendonca
― 9 min lire
Un nouveau cadre permet de créer des scénarios de trafic réalistes pour tester les voitures autonomes.
Shuhan Tan, Boris Ivanovic, Yuxiao Chen
― 6 min lire
Une étude compare les capacités des humains et de l'IA à reconnaître des formes 3D sous différents angles.
Tyler Bonnen, Stephanie Fu, Yutong Bai
― 7 min lire
Une nouvelle approche pour améliorer les scènes 3D avec la physique.
Piotr Borycki, Weronika Smolak, Joanna Waczyńska
― 8 min lire
Examiner comment les modèles de vision par ordinateur peuvent s'aligner avec la compréhension visuelle humaine.
Mohammad-Javad Darvishi-Bayazi, Md Rifat Arefin, Jocelyn Faubert
― 7 min lire
Une nouvelle méthode améliore la clarté des dialogues grâce à des expressions référentielles efficaces.
Bram Willemsen, Gabriel Skantze
― 8 min lire
De nouvelles méthodes améliorent la précision de la reconnaissance d'écriture manuscrite grâce à l'intégration du Relaxation Labelling.
Sara Ferro, Alessandro Torcinovich, Arianna Traviglia
― 8 min lire
CerviXpert veut améliorer la détection du cancer du col de l'utérus tout en utilisant moins de ressources.
Rashik Shahriar Akash, Radiful Islam, S. M. Saiful Islam Badhon
― 10 min lire
Une nouvelle méthode améliore l'apprentissage continu en détection d'objets.
Riccardo De Monte, Davide Dalle Pezze, Marina Ceccon
― 9 min lire
Une nouvelle méthode améliore la reconnaissance dans des éclairages difficiles pour les systèmes de sécurité.
Jiarui Li, Zhen Qiu, Yilin Yang
― 7 min lire
Des méthodes avancées améliorent la précision dans l'estimation des hauteurs des arbres pour une meilleure gestion des forêts.
Grace Colverd, Jumpei Takami, Laura Schade
― 8 min lire
Un nouveau jeu de données vise à améliorer les méthodes de détection de morphing facial.
Haoyu Zhang, Raghavendra Ramachandra, Kiran Raja
― 9 min lire
Les chercheurs améliorent la génération de données grâce à l'étude des Autoencodeurs Variationnels Hiérarchiques Conditionnels.
Wei Peng, Tian Xia, Fabio De Sousa Ribeiro
― 6 min lire
Cette recherche vise à créer des CAPTCHAs qui embrouillent les machines mais qui sont clairs pour les humains.
Yahya Jabary, Andreas Plesner, Turlan Kuzhagaliyev
― 7 min lire
Un aperçu des améliorations et des défis dans la navigation des machines en utilisant la vision et le langage.
Xuesong Zhang, Jia Li, Yunbo Xu
― 6 min lire
HESSO simplifie la compression des modèles, rendant les réseaux de neurones plus efficaces sans perdre en performance.
Tianyi Chen, Xiaoyi Qu, David Aponte
― 9 min lire
Utiliser l'imagerie satellite et l'apprentissage automatique pour une classification des terres précise.
Soham Mukherjee, Yash Dixit, Naman Srivastava
― 7 min lire
Un nouveau cadre améliore la détection d'objets en identifiant des instances hors distribution à l'aide de prototypes.
Junkun Chen, Jilin Mei, Liang Chen
― 8 min lire
Une étude sur l'amélioration de la sécurité des piétons grâce aux modèles de prédiction de comportement.
Mohsen Azarmi, Mahdi Rezaei, He Wang
― 7 min lire
Présentation d'une nouvelle méthode pour segmenter avec précision les lésions cutanées en utilisant des techniques avancées.
Asim Naveed, Syed S. Naqvi, Tariq M. Khan
― 10 min lire
AstroMAE utilise des autoencodeurs masqués pour améliorer les prévisions de décalage vers le rouge en astronomie.
Amirreza Dolatpour Fathkouhi, Geoffrey Charles Fox
― 10 min lire
KRONC propose une méthode rapide pour estimer les positions de caméra en utilisant des points clés sur les véhicules.
Davide Di Nucci, Alessandro Simoni, Matteo Tomei
― 7 min lire
Une étude sur la manière dont Mamba s'en sort face aux Transformers pour les tâches image-texte.
Georgios Pantazopoulos, Malvina Nikandrou, Alessandro Suglia
― 9 min lire
Une nouvelle approche améliore la segmentation avec peu de données étiquetées.
Jiaqi Yang, Ye Huang, Xiangjian He
― 7 min lire
Une nouvelle façon de créer des aménagements 3D à partir d'entrées 2D.
Chengzeng Feng, Jiacheng Wei, Cheng Chen
― 6 min lire
Une nouvelle approche améliore le doublage visuel en optimisant le synchronisme labial et l'unicité des intervenants.
Longhao Zhang, Shuang Liang, Zhipeng Ge
― 8 min lire
Une nouvelle méthode améliore le diagnostic des tumeurs cérébrales tout en protégeant la vie privée des patients.
Rasoul Jafari Gohari, Laya Aliahmadipour, Ezat Valipour
― 7 min lire
La compétition met en avant des efforts pour des modèles de conduite plus sûrs dans des conditions difficiles.
Furqan Ahmed Shaik, Sandeep Nagar, Aiswarya Maturi
― 7 min lire
Un nouvel outil estime la pression artérielle pulmonaire en utilisant des vidéos d'imagerie cardiaque.
Michal K. Grzeszczyk, Przemysław Korzeniowski, Samer Alabed
― 7 min lire
Présentation de ERF-CondLaneNet pour une meilleure détection des voies dans des situations routières complexes.
Parth Ganeriwala, Siddhartha Bhattacharyya, Raja Muthalagu
― 8 min lire
Cette étude présente un modèle qui apprend des simulations à partir de vidéos.
Franciszek Szewczyk, Gilles Louppe, Matthia Sabatelli
― 7 min lire
Un nouveau jeu de données et une compétition font avancer les méthodes de détection des deepfakes pour la sécurité numérique.
Zhixi Cai, Abhinav Dhall, Shreya Ghosh
― 7 min lire
Découvre les avantages de la compression de représentation vidéo neuronale pour gérer les vidéos efficacement.
Ho Man Kwan, Ge Gao, Fan Zhang
― 7 min lire