Combinare dati testuali e visivi migliora le performance nel few-shot learning.
Heethanjan Kanagalingam, Thenukan Pathmanathan, Navaneethan Ketheeswaran
― 4 leggere min
Scienza all'avanguardia spiegata semplicemente
Combinare dati testuali e visivi migliora le performance nel few-shot learning.
Heethanjan Kanagalingam, Thenukan Pathmanathan, Navaneethan Ketheeswaran
― 4 leggere min
Esplorando le sfide e i progressi nel rilevare immagini artificiali mentre la tecnologia avanza.
Pablo Bernabeu-Perez, Enrique Lopez-Cuena, Dario Garcia-Gasulla
― 10 leggere min
Metodi migliorati per il rilevamento dei confini migliorano il modeling CAD dai scan 3D.
Sk Aziz Ali, Mohammad Sadil Khan, Didier Stricker
― 7 leggere min
Un nuovo modello migliora la compressione delle immagini senza perdere qualità.
Ryugo Morita, Hitoshi Nishimura, Ko Watanabe
― 5 leggere min
Questo studio punta a migliorare i modelli di generazione di immagini riducendo le caratteristiche anomale.
Hyunwoo Yoo
― 5 leggere min
Un nuovo metodo accelera la creazione di avatar 3D per teste realistici.
Peizhi Yan, Rabab Ward, Qiang Tang
― 6 leggere min
Uno studio rivela che il bias contestuale influisce sulle prestazioni di rilevamento degli oggetti in diversi ambienti.
Hojun Son, Arpan Kusari
― 6 leggere min
Nuovi metodi migliorano il realismo dei riflessi nello specchio nelle immagini generate al computer.
Ankit Dhiman, Manan Shah, Rishubh Parihar
― 5 leggere min
Un nuovo approccio migliora l'apprendimento dei robot combinando istruzioni linguistiche dettagliate con i dati.
Yinpei Dai, Jayjun Lee, Nima Fazeli
― 6 leggere min
Nuovi metodi migliorano la chiarezza delle immagini del fondo oculare per una diagnosi migliore.
Xuanzhao Dong, Vamsi Krishna Vasa, Wenhui Zhu
― 5 leggere min
EQ-CBM migliora la comprensione dell'AI grazie a una codifica dei concetti migliore e a maggiore flessibilità.
Sangwon Kim, Dasom Ahn, Byoung Chul Ko
― 6 leggere min
Un nuovo framework migliora le prestazioni di CLIP con tecniche di potatura dei token davvero efficaci.
Cheng-En Wu, Jinhong Lin, Yu Hen Hu
― 5 leggere min
Un nuovo metodo migliora il rinnovamento urbano combinando tecnologia e feedback della comunità.
Chuanbo Hu, Shan Jia, Xin Li
― 8 leggere min
Un nuovo metodo migliora l'accuratezza del tracciamento in scene in movimento rapido usando tecnologia basata su eventi.
Maria Zafeiri, Georgios Evangelidis, Emmanouil Psarakis
― 5 leggere min
Questa ricerca punta a migliorare gli strumenti di prova virtuale per gioielli e orologi.
Ting-Yu Chang, Seretsi Khabane Lekena
― 6 leggere min
Un nuovo metodo migliora come i robot afferrano e tengono gli oggetti in modo efficace.
Ninad Khargonkar, Luis Felipe Casas, Balakrishnan Prabhakaran
― 6 leggere min
Video-XL gestisce alla grande video lunghi, aumentando precisione e prestazioni.
Yan Shu, Peitian Zhang, Zheng Liu
― 6 leggere min
Il framework PACU migliora i VLLM affinando i prompt e utilizzando le didascalie delle immagini.
Minyi Zhao, Jie Wang, Zhaoyang Li
― 6 leggere min
Un nuovo metodo migliora la precisione nella lettura dei testi da immagini sfocate.
Minyi Zhao, Yang Wang, Jihong Guan
― 5 leggere min
Esplorando un nuovo dataset per la registrazione di nuvole di punti non rigide.
Sara Monji-Azad, Marvin Kinz, Claudia Scherl
― 6 leggere min
La radiomica della risonanza magnetica migliora la diagnosi del glioblastoma attraverso la previsione dei marker genetici.
Stanislav Kozák
― 6 leggere min
Un nuovo metodo per proteggere i diritti individuali dall'uso improprio delle immagini nelle animazioni.
Jiachen Zhou, Mingsi Wang, Tianlin Li
― 6 leggere min
La ricerca si concentra su descrizioni delle immagini migliori e tecniche di manipolazione robotica.
Huy Hoang Nguyen, An Vuong, Anh Nguyen
― 7 leggere min
Nuovi metodi migliorano le previsioni della distanza RNA usando tecniche avanzate di machine learning.
Jiaxing Yang
― 4 leggere min
Un nuovo approccio migliora il video question answering grazie al riconoscimento del testo nelle scene.
Sheng Zhou, Junbin Xiao, Xun Yang
― 7 leggere min
Questo articolo parla di DilateQuant per migliorare la velocità e l'accuratezza dei modelli di diffusione.
Xuewen Liu, Zhikai Li, Qingyi Gu
― 7 leggere min
Bilanciare privacy e prestazioni nell'IA attraverso tecniche innovative di dimenticamento.
Dasol Choi, Dongbin Na
― 6 leggere min
EVA unisce segnali audio e visivi per una migliore precisione nel riconoscimento vocale.
Yihan Wu, Yifan Peng, Yichen Lu
― 5 leggere min
PPNG offre un modo compatto per catturare e condividere visivi 3D facilmente.
Jae Yong Lee, Yuqun Wu, Chuhang Zou
― 6 leggere min
Nuovi set di dati e modelli migliorano il rilevamento di parassiti e malattie negli alberi e nei raccolti.
Mingle Zhou, Rui Xing, Delong Han
― 8 leggere min
Nuovi metodi migliorano la precisione nell'identificare i vasi sanguigni nelle immagini mediche.
Amine Sadikine, Bogdan Badic, Enzo Ferrante
― 6 leggere min
Questo articolo parla dell'efficacia della Struttura da Movimento per un modello 3D preciso.
Francisco Roza de Moraes, Irineu da Silva
― 5 leggere min
Un nuovo metodo migliora il modo in cui i robot esplorano spazi interni strutturati.
Cherie Ho, Seungchan Kim, Brady Moon
― 5 leggere min
Un modello automatizzato migliora la creazione di referti patologici multi-organo.
Jing Wei Tan, SeungKyu Kim, Eunsu Kim
― 5 leggere min
Un nuovo metodo migliora la segmentazione dei vasi epatici nell'imaging medico.
Amine Sadikine, Bogdan Badic, Jean-Pierre Tasu
― 5 leggere min
Un nuovo metodo accelera i modelli di diffusione mantenendo la qualità dell'immagine.
Alireza Ganjdanesh, Yan Kang, Yuchen Liu
― 6 leggere min
Un nuovo approccio combina LiDAR e telecamere per una migliore precisione di rilevamento.
Vanshika Vats, Marzia Binta Nizam, James Davis
― 6 leggere min
Nuovi metodi migliorano il tracciamento della posizione degli oggetti in aree urbane densamente popolate.
Tavis Shore, Oscar Mendez, Simon Hadfield
― 7 leggere min
Questo studio esamina come la gente distingue tra volti reali e volti generati dall'IA.
Jin Huang, Subhadra Gopalakrishnan, Trisha Mittal
― 5 leggere min
Llama-AVSR unisce audio e input visivi per migliorare l'accuratezza del riconoscimento vocale.
Umberto Cappellazzo, Minsu Kim, Honglie Chen
― 7 leggere min