CC-OCR fissa un nuovo standard per valutare i sistemi di riconoscimento del testo.
Zhibo Yang, Jun Tang, Zhaohai Li
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
CC-OCR fissa un nuovo standard per valutare i sistemi di riconoscimento del testo.
Zhibo Yang, Jun Tang, Zhaohai Li
― 6 leggere min
Combinare CNN e Transformer migliora l'accuratezza e le prestazioni nel riconoscimento facciale.
Pritesh Prakash, Ashish Jacob Sam
― 7 leggere min
Un nuovo metodo migliora la chiarezza delle immagini fMRI dei ratti.
Sima Soltanpour, Arnold Chang, Dan Madularu
― 7 leggere min
VideoICL migliora il modo in cui i computer comprendono i contenuti video attraverso l'apprendimento basato su esempi.
Kangsan Kim, Geon Park, Youngwan Lee
― 5 leggere min
Un nuovo metodo migliora l'accuratezza nei referti automatici delle radiografie toraciche.
R. Mahmood, K. C. L. Wong, D. M. Reyes
― 6 leggere min
Nuova tecnologia semplifica la conversione di matematica scritta a mano in formato LaTeX.
Jayaprakash Sundararaj, Akhil Vyas, Benjamin Gonzalez-Maldonado
― 6 leggere min
DiffVox offre un metodo più veloce e sicuro per l'imaging medico.
Mohammadhossein Momeni, Vivek Gopalakrishnan, Neel Dey
― 6 leggere min
Un nuovo metodo per immagini più chiare separando oggetti fissi e in movimento.
Jingyu Lin, Jiaqi Gu, Lubin Fan
― 6 leggere min
Scopri come LL-ICM migliora la qualità delle immagini riducendo le dimensioni dei file.
Yuan Xue, Qi Zhang, Chuanmin Jia
― 7 leggere min
Un modo più intelligente per rilevare oggetti pericolosi ai controlli di sicurezza.
Sanjoeng Wong, Yan Yan
― 7 leggere min
La rilevazione avanzata dell'editing delle immagini combina analisi testuale e visiva per una maggiore accuratezza.
Quang Nguyen, Truong Vu, Trong-Tung Nguyen
― 8 leggere min
Un'immersione profonda nelle tecniche per segmentare superfici nella visione artificiale.
Lukas Baumgärtner, Ronny Bergmann, Roland Herzog
― 7 leggere min
Scopri come la tecnologia trasforma l'animazione dei personaggi per i videogiochi.
Cheng-An Hsieh, Jing Zhang, Ava Yan
― 6 leggere min
Scopri nuovi metodi per migliorare la qualità delle immagini digitali.
Matthieu Terris, Ulugbek S. Kamilov, Thomas Moreau
― 5 leggere min
L'adattatore MV trasforma la creazione di immagini permettendo di avere più punti di vista senza sforzo.
Zehuan Huang, Yuan-Chen Guo, Haoran Wang
― 7 leggere min
Scopri come i Modelli di Navigazione aiutano i robot ad adattarsi ai loro ambienti.
Amir Bar, Gaoyue Zhou, Danny Tran
― 8 leggere min
Scopri come i ricercatori creano modelli 3D da immagini 2D usando nuove tecniche.
Qitao Zhao, Shubham Tulsiani
― 6 leggere min
Nuovi metodi migliorano la comprensione da parte delle macchine degli eventi video usando query in linguaggio naturale.
Cristobal Eyzaguirre, Eric Tang, Shyamal Buch
― 8 leggere min
Una sfida globale per automatizzare la rilevazione delle cartilagini di crescita nelle ossa dei topi.
Nikolay Burlutskiy, Marija Kekic, Jordi de la Torre
― 6 leggere min
FLAIR collega immagini e testo come mai prima d'ora, migliorando il riconoscimento dei dettagli.
Rui Xiao, Sanghwan Kim, Mariana-Iuliana Georgescu
― 5 leggere min
Nuovo metodo trasforma immagini piatte in scene 3D vivaci.
Zehuan Huang, Yuan-Chen Guo, Xingqiao An
― 6 leggere min
I VLM mescolano visione e linguaggio, creando macchine più intelligenti che capiscono meglio il mondo.
Andreas Steiner, André Susano Pinto, Michael Tschannen
― 6 leggere min
I Token di Percezione migliorano la capacità dell'IA di capire e interpretare le immagini.
Mahtab Bigverdi, Zelun Luo, Cheng-Yu Hsieh
― 7 leggere min
Scopri come Bullet Timer trasforma i video in scene 3D dinamiche.
Hanxue Liang, Jiawei Ren, Ashkan Mirzaei
― 7 leggere min
Un nuovo sistema assicura video multi-angolo costanti per un migliore addestramento delle auto a guida autonoma.
Hannan Lu, Xiaohe Wu, Shudong Wang
― 7 leggere min
I ricercatori affrontano i problemi del rolling shutter nelle immagini a campo luminoso per foto più chiare.
Hermes McGriff, Renato Martins, Nicolas Andreff
― 6 leggere min
Knowledge-CLIP migliora l'allineamento tra immagini e testo attraverso strategie di apprendimento avanzate.
Kuei-Chun Kao
― 6 leggere min
Scopri come la corrispondenza semantica migliora il riconoscimento delle immagini e le applicazioni tecnologiche.
Frank Fundel, Johannes Schusterbauer, Vincent Tao Hu
― 6 leggere min
Scopri come il riconoscimento della camminata sta cambiando i metodi di identificazione grazie ai modelli di cammino.
Proma Hossain Progga, Md. Jobayer Rahman, Swapnil Biswas
― 5 leggere min
Urban4D ridefinisce la ricostruzione delle scene urbane per città più intelligenti.
Ziwen Li, Jiaxin Huang, Runnan Chen
― 5 leggere min
Uno strumento intelligente che trasforma il modo in cui misuriamo vari oggetti senza sforzo.
Yongkyu Lee, Shivam Kumar Panda, Wei Wang
― 6 leggere min
Esaminando gli effetti del training multimodale sulle abilità linguistiche nell'IA.
Neale Ratzlaff, Man Luo, Xin Su
― 8 leggere min
Scopri come gli MLVGMs aiutano a proteggere i sistemi di visione artificiale dagli attacchi avversari.
Dario Serez, Marco Cristani, Alessio Del Bue
― 7 leggere min
Un nuovo metodo veloce per ricreare spazi interni in 3D offre precisione ed efficienza.
Bin Tan, Rui Yu, Yujun Shen
― 6 leggere min
I ricercatori hanno sviluppato un nuovo modello per video di canto vivace, migliorando le animazioni.
Yan Li, Ziya Zhou, Zhiqiang Wang
― 7 leggere min
Combinare dati HSI e LiDAR per un'analisi efficiente.
Judy X Yang, Jing Wang, Chen Hong Sui
― 9 leggere min
Nuove tecniche di deep learning migliorano le misurazioni della temperatura della superficie del mare nonostante le sfide delle nuvole.
Andrea Asperti, Ali Aydogdu, Emanuela Clementi
― 6 leggere min
PrefixKV ottimizza grandi modelli visione-lingua per migliori prestazioni e meno utilizzo di risorse.
Ao Wang, Hui Chen, Jianchao Tan
― 7 leggere min
Un nuovo metodo migliora la generazione di immagini usando scheletri digitali.
Aron Fóthi, Bence Fazekas, Natabara Máté Gyöngyössy
― 5 leggere min
Uno sguardo a come la tecnologia sta trasformando la chirurgia per il cancro esofageo.
Ronald L. P. D. de Jong, Yasmina al Khalil, Tim J. M. Jaspers
― 7 leggere min