La rilevazione avanzata dell'editing delle immagini combina analisi testuale e visiva per una maggiore accuratezza.
Quang Nguyen, Truong Vu, Trong-Tung Nguyen
― 8 leggere min
Scienza all'avanguardia spiegata semplicemente
La rilevazione avanzata dell'editing delle immagini combina analisi testuale e visiva per una maggiore accuratezza.
Quang Nguyen, Truong Vu, Trong-Tung Nguyen
― 8 leggere min
Un'immersione profonda nelle tecniche per segmentare superfici nella visione artificiale.
Lukas Baumgärtner, Ronny Bergmann, Roland Herzog
― 7 leggere min
Scopri come la tecnologia trasforma l'animazione dei personaggi per i videogiochi.
Cheng-An Hsieh, Jing Zhang, Ava Yan
― 6 leggere min
Scopri nuovi metodi per migliorare la qualità delle immagini digitali.
Matthieu Terris, Ulugbek S. Kamilov, Thomas Moreau
― 5 leggere min
L'adattatore MV trasforma la creazione di immagini permettendo di avere più punti di vista senza sforzo.
Zehuan Huang, Yuan-Chen Guo, Haoran Wang
― 7 leggere min
Scopri come i Modelli di Navigazione aiutano i robot ad adattarsi ai loro ambienti.
Amir Bar, Gaoyue Zhou, Danny Tran
― 8 leggere min
Scopri come i ricercatori creano modelli 3D da immagini 2D usando nuove tecniche.
Qitao Zhao, Shubham Tulsiani
― 6 leggere min
Nuovi metodi migliorano la comprensione da parte delle macchine degli eventi video usando query in linguaggio naturale.
Cristobal Eyzaguirre, Eric Tang, Shyamal Buch
― 8 leggere min
Una sfida globale per automatizzare la rilevazione delle cartilagini di crescita nelle ossa dei topi.
Nikolay Burlutskiy, Marija Kekic, Jordi de la Torre
― 6 leggere min
FLAIR collega immagini e testo come mai prima d'ora, migliorando il riconoscimento dei dettagli.
Rui Xiao, Sanghwan Kim, Mariana-Iuliana Georgescu
― 5 leggere min
Nuovo metodo trasforma immagini piatte in scene 3D vivaci.
Zehuan Huang, Yuan-Chen Guo, Xingqiao An
― 6 leggere min
I VLM mescolano visione e linguaggio, creando macchine più intelligenti che capiscono meglio il mondo.
Andreas Steiner, André Susano Pinto, Michael Tschannen
― 6 leggere min
I Token di Percezione migliorano la capacità dell'IA di capire e interpretare le immagini.
Mahtab Bigverdi, Zelun Luo, Cheng-Yu Hsieh
― 7 leggere min
Scopri come Bullet Timer trasforma i video in scene 3D dinamiche.
Hanxue Liang, Jiawei Ren, Ashkan Mirzaei
― 7 leggere min
Un nuovo sistema assicura video multi-angolo costanti per un migliore addestramento delle auto a guida autonoma.
Hannan Lu, Xiaohe Wu, Shudong Wang
― 7 leggere min
I ricercatori affrontano i problemi del rolling shutter nelle immagini a campo luminoso per foto più chiare.
Hermes McGriff, Renato Martins, Nicolas Andreff
― 6 leggere min
Knowledge-CLIP migliora l'allineamento tra immagini e testo attraverso strategie di apprendimento avanzate.
Kuei-Chun Kao
― 6 leggere min
Scopri come la corrispondenza semantica migliora il riconoscimento delle immagini e le applicazioni tecnologiche.
Frank Fundel, Johannes Schusterbauer, Vincent Tao Hu
― 6 leggere min
Scopri come il riconoscimento della camminata sta cambiando i metodi di identificazione grazie ai modelli di cammino.
Proma Hossain Progga, Md. Jobayer Rahman, Swapnil Biswas
― 5 leggere min
Urban4D ridefinisce la ricostruzione delle scene urbane per città più intelligenti.
Ziwen Li, Jiaxin Huang, Runnan Chen
― 5 leggere min
Uno strumento intelligente che trasforma il modo in cui misuriamo vari oggetti senza sforzo.
Yongkyu Lee, Shivam Kumar Panda, Wei Wang
― 6 leggere min
Esaminando gli effetti del training multimodale sulle abilità linguistiche nell'IA.
Neale Ratzlaff, Man Luo, Xin Su
― 8 leggere min
Scopri come gli MLVGMs aiutano a proteggere i sistemi di visione artificiale dagli attacchi avversari.
Dario Serez, Marco Cristani, Alessio Del Bue
― 7 leggere min
Un nuovo metodo veloce per ricreare spazi interni in 3D offre precisione ed efficienza.
Bin Tan, Rui Yu, Yujun Shen
― 6 leggere min
I ricercatori hanno sviluppato un nuovo modello per video di canto vivace, migliorando le animazioni.
Yan Li, Ziya Zhou, Zhiqiang Wang
― 7 leggere min
Combinare dati HSI e LiDAR per un'analisi efficiente.
Judy X Yang, Jing Wang, Chen Hong Sui
― 9 leggere min
Nuove tecniche di deep learning migliorano le misurazioni della temperatura della superficie del mare nonostante le sfide delle nuvole.
Andrea Asperti, Ali Aydogdu, Emanuela Clementi
― 6 leggere min
PrefixKV ottimizza grandi modelli visione-lingua per migliori prestazioni e meno utilizzo di risorse.
Ao Wang, Hui Chen, Jianchao Tan
― 7 leggere min
Un nuovo metodo migliora la generazione di immagini usando scheletri digitali.
Aron Fóthi, Bence Fazekas, Natabara Máté Gyöngyössy
― 5 leggere min
Uno sguardo a come la tecnologia sta trasformando la chirurgia per il cancro esofageo.
Ronald L. P. D. de Jong, Yasmina al Khalil, Tim J. M. Jaspers
― 7 leggere min
Questo articolo parla di un nuovo metodo per il rendering di immagini 3D realistico.
Chinmay Talegaonkar, Yash Belhe, Ravi Ramamoorthi
― 9 leggere min
Un nuovo modo per migliorare la qualità delle immagini usando tecniche innovative.
Qinwei Lin, Xiaopeng Sun, Yu Gao
― 5 leggere min
CUFIT aiuta i modelli a imparare meglio nonostante etichette rumorose nell'analisi delle immagini.
Yeonguk Yu, Minhwan Ko, Sungho Shin
― 7 leggere min
Una tecnica innovativa migliora le immagini mediche per una migliore formazione dell'IA e diagnosi.
Yiqin Zhang, Qingkui Chen, Chen Huang
― 5 leggere min
Scopri come i ricercatori migliorano l'equità nella tecnologia di riconoscimento facciale.
Alexandre Fournier-Montgieux, Michael Soumm, Adrian Popescu
― 6 leggere min
UniVAD migliora il rilevamento delle anomalie in vari settori con un minimo di addestramento.
Zhaopeng Gu, Bingke Zhu, Guibo Zhu
― 7 leggere min
Scopri come la sintesi di immagini da angolazioni diverse mescola prospettive per creare immagini realistiche.
Tao Jun Lin, Wenqing Wang, Yujiao Shi
― 6 leggere min
I robot stanno imparando a svolgere più compiti e ad adattarsi a diversi ambienti.
Junjie Wen, Minjie Zhu, Yichen Zhu
― 6 leggere min
I ricercatori stanno migliorando la rilevazione del glaucoma grazie a metodi innovativi di generazione dei dati.
Youssof Nawar, Nouran Soliman, Moustafa Wassel
― 7 leggere min
Esaminando l'efficacia e le vulnerabilità dei watermark semantici nei contenuti digitali.
Andreas Müller, Denis Lukovnikov, Jonas Thietke
― 5 leggere min