Scopri la magia di creare immagini da semplici descrizioni testuali.
NVIDIA, Yuval Atzmon, Maciej Bala
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Scopri la magia di creare immagini da semplici descrizioni testuali.
NVIDIA, Yuval Atzmon, Maciej Bala
― 5 leggere min
Questo articolo esplora come l'attività cerebrale sia legata a ciò che vediamo.
Yanchen Wang, Adam Turnbull, Tiange Xiang
― 6 leggere min
Un nuovo dataset aiuta a migliorare l'analisi delle immagini mediche e a capire meglio l'incertezza.
Jannik Franzen, Claudia Winklmayr, Vanessa E. Guarino
― 7 leggere min
Impara a descrivere video lunghi in modo chiaro ed efficace.
Yichen He, Yuan Lin, Jianchao Wu
― 6 leggere min
Un metodo per semplificare e migliorare la generazione di mesh 3D.
Haohan Weng, Zibo Zhao, Biwen Lei
― 6 leggere min
Misurare le prestazioni dei modelli generativi per risultati diversi.
Mohammad Jalali, Azim Ospanov, Amin Gohari
― 4 leggere min
SPECTRUM migliora i sottotitoli dei video integrando emozioni e contesto per un'esperienza di visione migliore.
Ehsan Faghihi, Mohammedreza Zarenejad, Ali-Asghar Beheshti Shirazi
― 5 leggere min
MapSAM rivoluziona il modo in cui analizziamo le mappe storiche in modo efficiente.
Xue Xia, Daiwei Zhang, Wenxuan Song
― 6 leggere min
Un nuovo metodo migliora le prestazioni del modello su diversi tipi di dati.
Beier Zhu, Jiequan Cui, Hanwang Zhang
― 5 leggere min
Questo framework aiuta le macchine a ricordare compiti vecchi mentre ne imparano di nuovi.
Pascal Janetzky, Tobias Schlagenhauf, Stefan Feuerriegel
― 6 leggere min
EVQAScore migliora l'evaluation del QA video in modo efficiente ed efficace.
Hao Liang, Zirong Chen, Wentao Zhang
― 6 leggere min
Un nuovo dataset cattura i comportamenti di accoppiamento dei blackbuck usando la tecnologia dei droni.
Hemal Naik, Junran Yang, Dipin Das
― 7 leggere min
Nuove metriche migliorano la valutazione della qualità video per task di riconoscimento automatico.
Mikhail Dremin, Konstantin Kozhemyakov, Ivan Molodetskikh
― 8 leggere min
Uno sguardo a come le macchine imparano attraverso l'Integrazione della Conoscenza a più fasi.
Hongsheng Zhang, Zhong Ji, Jingren Liu
― 6 leggere min
Mediffusion usa l'IA per classificare e generare immagini mediche in modo efficace.
Joanna Kaleta, Paweł Skierś, Jan Dubiński
― 6 leggere min
Scopri come l'IA aiuta gli artisti a creare schemi strutturati senza sforzo.
Marzia Riso, Giuseppe Vecchio, Fabio Pellacini
― 7 leggere min
Un nuovo modo di unire immagini e testo per ottenere risultati di ricerca migliori.
Yeong-Joon Ju, Ho-Joong Kim, Seong-Whan Lee
― 5 leggere min
Questo articolo esamina strategie per migliorare l'apprendimento profondo in diversi contesti di immagini mediche.
Zixian Su, Jingwei Guo, Xi Yang
― 9 leggere min
Uno sguardo all'analisi delle forme e al suo significato in vari campi.
Oguzhan Yigit, Richard C. Wilson
― 5 leggere min
WeatherGFM offre un modello flessibile per migliorare le previsioni e l'analisi del tempo.
Xiangyu Zhao, Zhiwang Zhou, Wenlong Zhang
― 5 leggere min
Un nuovo approccio per migliorare il rilevamento OOD nei modelli di machine learning.
Shawn Li, Huixian Gong, Hao Dong
― 6 leggere min
TractoEmbed aiuta i ricercatori a segmentare con precisione i tratti della sostanza bianca del cervello.
Anoushkrit Goel, Bipanjit Singh, Ankita Joshi
― 6 leggere min
Symile combina diversi tipi di dati per avere approfondimenti e comprensioni più profonde.
Adriel Saporta, Aahlad Puli, Mark Goldstein
― 6 leggere min
EAPCR fornisce spunti rivelando relazioni nascoste nei dati scientifici complessi.
Zhuohang Yu, Ling An, Yansong Li
― 7 leggere min
CameraHMR migliora la modellazione 3D da singole immagini con forme e pose del corpo precise.
Priyanka Patel, Michael J. Black
― 8 leggere min
I modelli di diffusione migliorano la visione artificiale per la profondità, il movimento e il rilevamento di oggetti nascosti.
Rahul Ravishankar, Zeeshan Patel, Jathushan Rajasegaran
― 6 leggere min
WaLa semplifica la creazione di forme 3D dettagliate in modo efficiente.
Aditya Sanghi, Aliasghar Khani, Pradyumna Reddy
― 7 leggere min
I ricercatori migliorano il riconoscimento dei semafori per le auto a guida autonoma in cattive condizioni meteo.
Ishaan Gakhar, Aryesh Guha, Aryaman Gupta
― 6 leggere min
RadioActive migliora la segmentazione interattiva per le immagini mediche 3D, aiutando i dottori nella diagnosi.
Constantin Ulrich, Tassilo Wald, Emily Tempus
― 8 leggere min
Esplorando i modi in cui gli esseri umani e l'IA riconoscono schemi e risolvono problemi.
Binxu Wang, Jiaqi Shang, Haim Sompolinsky
― 6 leggere min
I ricercatori migliorano l'individuazione dei tumori nelle scansioni MRI dei topi usando nnU-Net.
Piotr Kaniewski, Fariba Yousefi, Yeman Brhane Hagos
― 6 leggere min
Sfruttare piccoli sensori e modelli intelligenti per tenere d'occhio la fauna in modo efficace.
Emmanuel Azuh Mensah, Anderson Lee, Haoran Zhang
― 9 leggere min
Un progetto focalizzato sul rilevamento delle emozioni dei bambini online usando l'analisi facciale.
Sanchayan Vivekananthan
― 8 leggere min
Scopri come ImageRAG semplifica l'analisi di immagini satellitari dettagliate.
Zilun Zhang, Haozhan Shen, Tiancheng Zhao
― 8 leggere min
Uno studio confronta modelli di IA nella comprensione delle relazioni spaziali.
Shang Hong Sim, Clarence Lee, Alvin Tan
― 7 leggere min
CP-Mix migliora il riconoscimento delle immagini per classi rare usando metodi di abbinamento delle confusioni.
Youngseok Yoon, Sangwoo Hong, Hyungjoon Joo
― 5 leggere min
Tecniche avanzate svelano il funzionamento interno della mano umana.
Jingtao Huang, Bohan Wang, Zhiyuan Gao
― 5 leggere min
VidMan insegna ai robot a imparare compiti guardando video, migliorando le loro abilità in modo efficace.
Youpeng Wen, Junfan Lin, Yi Zhu
― 8 leggere min
Un metodo di deep learning migliora la velocità e la qualità delle immagini MRI.
Xingjian Tang, Jingwei Guan, Linge Li
― 7 leggere min
UniHOI fa progressi nello studio dell'interazione uomo-oggetto nei video.
Chengbo Yuan, Geng Chen, Li Yi
― 5 leggere min