Questo articolo analizza come unire immagini reali e sintetiche aumenti l'accuratezza e l'equità nel riconoscimento facciale.
Andrea Atzori, Pietro Cosseddu, Gianni Fenu
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo articolo analizza come unire immagini reali e sintetiche aumenti l'accuratezza e l'equità nel riconoscimento facciale.
Andrea Atzori, Pietro Cosseddu, Gianni Fenu
― 5 leggere min
Nuovo metodo genera modelli umani 3D realistici da immagini singole usando tecniche video avanzate.
Zhibin Liu, Haoye Dong, Aviral Chharia
― 6 leggere min
Metodo innovativo combina apprendimento automatico e fisica per risolvere equazioni differenziali.
Kai-liang Lu, Yu-meng Su, Zhuo Bi
― 7 leggere min
Introduzione di nuove metriche per valutare i sistemi di generazione di testo scritto a mano.
Konstantina Nikolaidou, George Retsinas, Giorgos Sfikas
― 7 leggere min
Un nuovo metodo migliora le previsioni dei movimenti delle mani nei video per robot e realtà virtuale.
Junyi Ma, Xieyuanli Chen, Wentao Bao
― 6 leggere min
Un nuovo modello migliora i suggerimenti di articoli di moda usando geometria e dati visivi.
Ryotaro Shimizu, Yu Wang, Masanari Kimura
― 5 leggere min
Un nuovo metodo prevede il BMI usando stili di scrittura e deep learning.
N. T. Diba, N. Akter, S. A. H. Chowdhury
― 7 leggere min
Uno studio rivela il ruolo dei dati vocali nel riconoscere le emozioni nei parlanti spagnoli.
Elena Ortega-Beltrán, Josep Cabacas-Maso, Ismael Benito-Altamirano
― 6 leggere min
Questo studio presenta un modello che integra il contesto per un riconoscimento migliore delle espressioni facciali.
Florian Blume, Runfeng Qu, Pia Bideau
― 8 leggere min
Nuovi modelli migliorano il rilevamento dei danni stradali con i droni, aumentando la sicurezza in città.
Weichao Pan, Xu Wang, Wenqing Huan
― 5 leggere min
StyleTokenizer migliora la generazione di immagini separando lo stile dalle istruzioni testuali.
Wen Li, Muyuan Fang, Cheng Zou
― 7 leggere min
Questo approccio combina autoencoder e tecniche di diffusione per immagini più chiare.
Vighnesh Birodkar, Gabriel Barcik, James Lyon
― 6 leggere min
Plane2Depth migliora la stima della profondità in scene complesse, affrontando le sfide delle texture scarso.
Li Liu, Ruijie Zhu, Jiacheng Deng
― 6 leggere min
Questa ricerca migliora la stima della profondità nei robot usando il meta-apprendimento per una resa migliore in ambienti diversi.
Cho-Ying Wu, Yiqi Zhong, Junying Wang
― 5 leggere min
Un sistema aiuta a identificare i piatti coreani per chi ha esigenze alimentari.
Hoang Khanh Lam, Kahandakanaththage Maduni Pramuditha Perera
― 6 leggere min
Nuovo metodo di generazione video migliora il realismo per l'addestramento delle auto a guida autonoma.
Jianbiao Mei, Xuemeng Yang, Licheng Wen
― 6 leggere min
Un nuovo framework migliora le descrizioni testuali usando immagini e dati strutturati.
Tahsina Hashem, Weiqing Wang, Derry Tanti Wijaya
― 5 leggere min
FODA-PG migliora la generazione di report dalle immagini mediche per diagnosi migliori.
Kai Shu, Yuzhuo Jia, Ziyang Zhang
― 6 leggere min
Un nuovo metodo e un dataset per l'analisi automatizzata delle cellule nella ricerca sul cervello.
Valentina Vadori, Jean-Marie Graïc, Antonella Peruffo
― 5 leggere min
Un nuovo approccio per creare immagini sintetiche in modo efficiente per la distillazione dei dataset.
Zhe Li, Weitong Zhang, Sarah Cechnicka
― 8 leggere min
Questo progetto esplora metodi di intelligenza artificiale per una classificazione dei rifiuti più efficiente.
Jenil Kanani
― 6 leggere min
Questo studio analizza l'uso di sistemi generativi per gestire fotografie storiche negli archivi catalani.
Èric Śanchez, Adrià Molina, Oriol Ramos Terrades
― 6 leggere min
MVTN migliora il riconoscimento dei gesti delle mani grazie a tecniche multiscala innovative.
Mallika Garg, Debashis Ghosh, Pyari Mohan Pradhan
― 5 leggere min
Questo studio analizza diversi modelli visivi per capire scene 3D complesse.
Yunze Man, Shuhong Zheng, Zhipeng Bao
― 9 leggere min
Questo studio valuta modelli di machine learning per rilevare rifiuti nei fiumi.
Marga Don, Stijn Pinson, Blanca Guillen Cebrian
― 5 leggere min
GIMDiffusion semplifica la generazione 3D da descrizioni testuali usando immagini geometriche.
Slava Elizarov, Ciara Rowles, Simon Donné
― 6 leggere min
RealisHuman migliora la qualità delle immagini affinando i tratti umani nelle immagini generate.
Benzhi Wang, Jingkai Zhou, Jingqi Bai
― 5 leggere min
Un nuovo metodo migliora la ricostruzione della superficie da immagini sparse, garantendo dettagli ed efficienza.
Rui Peng, Shihe Shen, Kaiqiang Xiong
― 6 leggere min
SegTalker migliora i video di volti parlanti con texture realistiche e editing facile.
Lingyu Xiong, Xize Cheng, Jintao Tan
― 5 leggere min
TCDiff migliora la creazione di volti sintetici per una riconoscibilità facciale migliore.
Bernardo Biesseck, Pedro Vidal, Luiz Coelho
― 5 leggere min
Un nuovo metodo per valutare la robustezza nei classificatori ML usando la distanza avversariale.
Georg Siedel, Ekagra Gupta, Andrey Morozov
― 6 leggere min
Nuovi metodi migliorano le prestazioni delle reti neurali su dispositivi con risorse limitate.
Ali Aghababaei-Harandi, Massih-Reza Amini
― 6 leggere min
Esplorando i vantaggi della Rappresentazione Discreta Organizzata e Raggruppata nell'elaborazione delle immagini.
Rongzhen Zhao, Vivienne Wang, Juho Kannala
― 7 leggere min
FTLGAN migliora il riconoscimento facciale per immagini a bassa risoluzione, garantendo un'identificazione migliore.
Sebastian Pulgar, Domingo Mery
― 7 leggere min
Un nuovo metodo migliora l'accuratezza della segmentazione usando i modelli SAM e CLIP.
Xi Chen, Haosen Yang, Sheng Jin
― 5 leggere min
Lo studio analizza come i VLM classificano gli stili e gli attributi artistici.
Ombretta Strafforello, Derya Soydaner, Michiel Willems
― 6 leggere min
Nuovi metodi migliorano la precisione e l'efficienza del montaggio video.
Deyin Liu, Lin Yuanbo Wu, Xianghua Xie
― 6 leggere min
Nuovi metodi che usano l'incertezza per migliorare il rilevamento degli errori nell'analisi delle immagini mediche.
Prerak Mody, Nicolas F. Chaves-de-Plaza, Chinmay Rao
― 6 leggere min
Il nuovo modello LowFormer migliora la velocità e la precisione per i compiti visivi.
Moritz Nottebaum, Matteo Dunnhofer, Christian Micheloni
― 6 leggere min
Il nuovo metodo LM-Gaussian genera modelli 3D dettagliati usando solo immagini di input limitate.
Hanyang Yu, Xiaoxiao Long, Ping Tan
― 6 leggere min