Questo articolo parla del ruolo dell'IA generativa nel migliorare le applicazioni di visione artificiale.
Hans Aoyang Zhou, Dominik Wolfschläger, Constantinos Florides
― 8 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo articolo parla del ruolo dell'IA generativa nel migliorare le applicazioni di visione artificiale.
Hans Aoyang Zhou, Dominik Wolfschläger, Constantinos Florides
― 8 leggere min
Articoli più recenti
Xiaochuang Han, Marjan Ghazvininejad, Pang Wei Koh
― 7 leggere min
Zohaib Khan, Muhammad Khaquan, Omer Tafveez
― 6 leggere min
Nassim Ait Ali Braham, Conrad M Albrecht, Julien Mairal
― 7 leggere min
Kshitij Bhardwaj
― 5 leggere min
Daniele Rege Cambrin, Gabriele Scaffidi Militone, Luca Colomba
― 7 leggere min
Presentiamo un nuovo strumento per accelerare la pre-elaborazione VBM negli studi sul cervello.
Lukas Fisch, Nils R. Winter, Janik Goltermann
― 6 leggere min
Nuove tecniche di watermarking proteggono i creatori di immagini e combattono la disinformazione.
Alexander Varlamov, Daria Diatlova, Egor Spirin
― 5 leggere min
Scopri come diverse rappresentazioni di dati 3D rendono più facile l'analisi del machine learning.
Tomasz Prytuła
― 6 leggere min
Esplorare il ruolo delle proprietà geometriche nella qualità dei dati generati.
Ahmed Imtiaz Humayun, Ibtihel Amara, Candice Schumann
― 8 leggere min
Diff-PCC migliora l'efficienza e la qualità della compressione delle nuvole di punti usando modelli di diffusione.
Kai Liu, Kang You, Pan Gao
― 5 leggere min
Tecniche per ridurre la dimensione dei modelli per un'efficace distribuzione in ambienti a risorse limitate.
Alexandre Lopes, Fernando Pereira dos Santos, Diulhio de Oliveira
― 8 leggere min
Questo articolo esamina l'efficacia dei modelli 3D basati su immagini nella stima della posa.
Varun Burde, Assia Benbihi, Pavel Burget
― 8 leggere min
Un nuovo metodo mira a sistemi di autenticazione facciale multipla in modo efficiente.
Hanrui Wang, Shuo Wang, Cunjian Chen
― 9 leggere min
Lo studio valuta l'originalità nelle immagini generate dall'AI usando la misurazione dei token.
Adi Haviv, Shahar Sarfaty, Uri Hacohen
― 7 leggere min
Un nuovo approccio collega le tecniche di ripristino delle immagini con i compiti di visione artificiale usando meno dati.
Jiawei Wu, Zhi Jin
― 6 leggere min
Un nuovo metodo aumenta l'accuratezza della classificazione per le categorie di immagini comuni e rare.
Jiexuan Yan, Sheng Huang, Nankun Mu
― 5 leggere min
Nuovi benchmark testano il ragionamento causale dell'IA usando solo immagini.
Zhiyuan Li, Heng Wang, Dongnan Liu
― 8 leggere min
Un nuovo approccio migliora la ricostruzione di scene 3D a partire da una sola foto, concentrandosi sulle interazioni.
Sarthak Batra, Partha P. Chakrabarti, Simon Hadfield
― 4 leggere min
Esplorando il ruolo dei modelli di base nel superare la scarsità di dati nelle immagini mediche.
Stefano Woerner, Christian F. Baumgartner
― 6 leggere min
Un nuovo modello migliora l'accuratezza nel riconoscere i gesti delle mani per un'interazione senza soluzione di continuità.
Md Abdur Rahim, Abu Saleh Musa Miah, Hemel Sharker Akash
― 8 leggere min
DIVE migliora le descrizioni visive generate dalle macchine per una comprensione più profonda.
Jun-Hyung Park, Hyuntae Park, Youjin Kang
― 7 leggere min
Un nuovo metodo per modifiche 3D senza soluzione di continuità usando immagini multi-prospettiva.
Chenjie Cao, Chaohui Yu, Fan Wang
― 7 leggere min
Un nuovo metodo migliora il rilevamento di campioni positivi deboli in ambienti 3D.
Wenxuan Li, Qin Zou, Chi Chen
― 7 leggere min
Un nuovo metodo migliora il modo in cui i sistemi rispondono a domande visive.
Yili Li, Jing Yu, Keke Gai
― 5 leggere min
I ricercatori migliorano le immagini CT a conteggio di fotoni usando metodi di deep learning.
Chuang Niu, Christopher Wiedeman, Mengzhou Li
― 7 leggere min
Lo studio esplora metodi per la previsione del cancro usando dati etichettati e non etichettati.
Samta Rani, Tanvir Ahmad, Sarfaraz Masood
― 9 leggere min
Nuovi strumenti migliorano la formazione chirurgica usando dati video e testuali.
Jiajie Li, Garrett Skinner, Gene Yang
― 5 leggere min
Il nuovo modello migliora il riconoscimento delle attività indoor usando radar che attraversano i muri.
Xiaopeng Yang, Weicheng Gao, Xiaodong Qu
― 5 leggere min
MM-SAM migliora la segmentazione delle immagini integrando diversi tipi di dati dei sensori.
Aoran Xiao, Weihao Xuan, Heli Qi
― 7 leggere min
Un nuovo dataset migliora le prestazioni della fotocamera per le scene di guida notturna.
Zhenyi Liu, Devesh Shah, Brian Wandell
― 6 leggere min
Un nuovo metodo svela come i modelli visivi organizzano e comprendono le immagini.
Shashank Kotyan, Pin-Yu Chen, Danilo Vasconcellos Vargas
― 6 leggere min
Combinare metodi per una migliore stima della posizione della fotocamera da immagini sparse.
Hao Tang, Weiyao Wang, Pierre Gleize
― 6 leggere min
Nuovi metodi migliorano l'analisi emozionale usando vari tipi di dati.
Muhammad Haseeb Aslam, Marco Pedersoli, Alessandro Lameiras Koerich
― 6 leggere min
Un nuovo metodo migliora l'accuratezza nell'imaging e nella diagnosi dei tumori al cervello.
Subin Sahayam, John Michael Sujay Zakkam, Yoga Sri Varshan
― 6 leggere min
Un nuovo metodo punta sulle debolezze dei sistemi da immagine a testo per output dannosi.
Qingyuan Zeng, Zhenzhong Wang, Yiu-ming Cheung
― 5 leggere min
CytoDiffusion propone un nuovo modo di classificare le cellule del sangue e identificare anomalie.
Simon Deltadahl, Julian Gilbey, Christine Van Laer
― 6 leggere min
Un nuovo metodo migliora l'accuratezza dei report concentrandosi sulle anomalie rilevate nelle TC.
Theo Di Piazza
― 4 leggere min
Scopri come l'apprendimento federato migliora il rilevamento di piccoli oggetti mantenendo la privacy dei dati.
Vinit Hegiste, Snehal Walunj, Jibinraj Antony
― 4 leggere min
xGen-MM migliora i modelli multimodali per un apprendimento migliore di immagini e testo.
Le Xue, Manli Shu, Anas Awadalla
― 6 leggere min
Un metodo per migliorare i modelli visione-lingua senza dati etichettati.
Eman Ali, Sathira Silva, Muhammad Haris Khan
― 5 leggere min
Un sistema innovativo automatizza la generazione di suoni per film e giochi.
Junwon Lee, Jaekwon Im, Dabin Kim
― 8 leggere min
Un metodo per integrare nuovi modelli senza riprocessare le collezioni di immagini esistenti.
Simone Ricci, Niccolò Biondi, Federico Pernici
― 6 leggere min
NuSegDG offre un'accuratezza migliorata per l'analisi delle immagini mediche.
Zhenye Lou, Qing Xu, Zekun Jiang
― 6 leggere min
Nuovi metodi migliorano la modellazione 3D degli ambienti interni tramite campi vettoriali.
Albert Gassol Puigjaner, Edoardo Mello Rella, Erik Sandström
― 4 leggere min
Un nuovo metodo che utilizza modelli linguistici per comprimere efficacemente nuvole di punti 3D.
Yuqi Ye, Wei Gao
― 5 leggere min