Un nuovo modo per simulare l'invecchiamento del viso mantenendo l'identità.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo modo per simulare l'invecchiamento del viso mantenendo l'identità.
― 5 leggere min
Un nuovo modello migliora i collegamenti tra testo, immagini e audio.
― 6 leggere min
Un nuovo modello che migliora le prestazioni nei compiti visivi combinando CNN e Transformer.
― 5 leggere min
Nuovi metodi migliorano l'affidabilità delle previsioni in scenari difficili per i modelli di machine learning.
― 6 leggere min
La ricerca offre spunti su come rilevare scariche parziali nei sistemi ad alta tensione.
― 6 leggere min
Un nuovo metodo migliora la manipolazione delle immagini mantenendo intatta la qualità.
― 5 leggere min
Nuovi metodi migliorano la rimozione delle filigrane mantenendo la qualità dell'immagine.
― 6 leggere min
Il framework MonoLiG migliora il rilevamento 3D usando telecamere monoculari e dati LiDAR.
― 7 leggere min
NORIS migliora la selezione delle immagini per addestrare modelli di rilevamento oggetti in modo efficiente.
― 7 leggere min
CLIPInverter permette di modificare le immagini facilmente usando descrizioni in linguaggio naturale.
― 6 leggere min
Robust-Depth migliora la stima della profondità in diverse condizioni meteorologiche.
― 8 leggere min
M-FLAG migliora l'analisi delle immagini mediche usando modelli di linguaggio congelati e un addestramento ottimizzato.
― 5 leggere min
Un nuovo metodo migliora la generazione di immagini usando dati etichettati e non etichettati meno affidabili.
― 6 leggere min
Il framework HST mostra miglioramenti significativi nel tracciare oggetti tra i frame video.
― 5 leggere min
Modelli innovativi di spettri di scattering migliorano la gestione dell'incertezza nell'analisi dei dati complessi.
― 7 leggere min
LOAF offre un nuovo dataset per rilevare persone usando telecamere fisheye dall'alto.
― 7 leggere min
SDS-CLIP migliora le capacità di ragionamento immagine-testo di CLIP.
― 7 leggere min
RepViT combina CNN e ViT per applicazioni di visione mobile efficienti.
― 6 leggere min
Il modello ConViT migliora il riconoscimento delle azioni umane nelle immagini fisse usando il deep learning.
― 6 leggere min
RCC-SGM migliora la chiarezza delle immagini nella tomografia fotoacustica senza bisogno di dataset abbinati.
― 5 leggere min
Nuovi metodi migliorano il rilevamento degli oggetti nella nebbia e nella pioggia per le auto a guida autonoma.
― 7 leggere min
Una nuova tecnica di filtraggio migliora la chiarezza delle spiegazioni sulle decisioni dell'IA.
― 7 leggere min
La ricerca rivela un nuovo dataset che migliora le prestazioni dei modelli VQA nel tempo.
― 5 leggere min
Un nuovo metodo migliora la conversione delle foto in schizzi dettagliati.
― 6 leggere min
Scopri come il deep learning trasforma la creazione di immagini con la sintesi 3D.
― 6 leggere min
DualAttNet migliora l'accuratezza nel rilevare le malattie polmonari grazie a metodi di attenzione innovativi.
― 5 leggere min
Nuovo metodo migliora i sistemi di risposta a domande video focalizzati sul traffico per prestazioni migliori.
― 7 leggere min
Un nuovo metodo migliora l'accuratezza nell'identificare le specie di legno dalle immagini microscopiche.
― 6 leggere min
Il deep learning migliora l'imaging Doppler a colori per un'analisi migliore del flusso sanguigno nel cuore.
― 6 leggere min
Un nuovo modello migliora la rilevazione delle interazioni chirurgiche tramite tecniche innovative.
― 6 leggere min
L'Augmentation Bayesiana Avversariale migliora la generalizzazione del modello con dati limitati.
― 4 leggere min
I dati aerei aiutano i proprietari di casa a valutare i risparmi e il potenziale dell'energia solare.
― 6 leggere min
Un nuovo metodo migliora le animazioni facciali modificando stili già esistenti.
― 6 leggere min
OnlineRefer migliora la segmentazione degli oggetti video collegando i fotogrammi attraverso la propagazione delle query.
― 6 leggere min
Questo studio valuta l'efficacia dei modelli VQA per scenari di guida.
― 5 leggere min
Un metodo per il grounding visivo 3D usando poche annotazioni.
― 5 leggere min
Questa ricerca migliora la capacità dei robot collaborativi di riconoscere le azioni umane.
― 6 leggere min
DiffInfinite genera immagini tissutali dettagliate, migliorando l'analisi e la formazione.
― 5 leggere min
Un nuovo approccio migliora l'identificazione delle persone nelle immagini con l'estrazione avanzata delle caratteristiche.
― 6 leggere min
Questo studio esamina metodi per recuperare immagini che supportano efficacemente gli argomenti.
― 7 leggere min