Nuovo modello migliora le previsioni delle interazioni tra oggetti usando video e immagini.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Nuovo modello migliora le previsioni delle interazioni tra oggetti usando video e immagini.
― 6 leggere min
Un nuovo sistema di imaging RF migliora il riconoscimento degli oggetti in ambienti difficili.
― 7 leggere min
Nuovo metodo migliora l'apprendimento federato proteggendo la privacy degli utenti.
― 6 leggere min
Questo studio esplora metodi avanzati per l'etichettatura dei dati in modo efficiente usando tecniche di reti neurali.
― 8 leggere min
Presentiamo CUT, un framework per la generazione di anomalie realistiche e diverse senza formazione extra.
― 6 leggere min
Un nuovo modo per unire canto e danza grazie a tecniche informatiche avanzate.
― 6 leggere min
Il modello CYCLO migliora la comprensione delle interazioni tra gli oggetti nei video dei droni.
― 6 leggere min
CV-VAE migliora l'efficienza e la qualità della generazione video nei modelli esistenti.
― 7 leggere min
MultiEdits permette di fare modifiche a immagini contemporaneamente tramite comandi testuali, migliorando l'efficienza e la qualità.
― 5 leggere min
Un nuovo modello migliora la comprensione delle immagini, concentrandosi sui dettagli con efficienza.
― 8 leggere min
Nuova tecnica migliora la generazione di immagini da prompt testuali.
― 6 leggere min
Questa ricerca mostra come le immagini e il testo interagiscono nei compiti di ragionamento.
― 7 leggere min
Un framework per individuare e ridurre i pregiudizi nei dataset di addestramento.
― 7 leggere min
Questo metodo migliora il tracciamento dei dati attraverso tecniche di watermarking avanzate.
― 6 leggere min
Nuovi metodi promettono reti neurali più veloci ed efficienti, usando meno risorse.
― 6 leggere min
Un nuovo metodo per migliorare i meccanismi di attenzione nella lavorazione di dati complessi.
― 7 leggere min
Esplorare come le macchine creano narrazioni da immagini e video.
― 8 leggere min
Open-YOLO 3D migliora la segmentazione delle istanze 3D con velocità e precisione.
― 7 leggere min
Un nuovo metodo migliora la velocità e la qualità della generazione di immagini e video.
― 6 leggere min
Un nuovo approccio migliora l'apprendimento visivo incorporando la rappresentazione di oggetti 3D.
― 8 leggere min
Un nuovo metodo stima i danni di guerra attraverso le immagini satellitari per l'aiuto umanitario.
― 7 leggere min
Questo studio esamina quanto bene i modelli pre-addestrati raggruppano dati non visti.
― 6 leggere min
RoomTex semplifica la creazione di texture di alta qualità per scene interne 3D.
― 6 leggere min
Un dataset punta ad automatizzare il tagging dei metadati per le organizzazioni del patrimonio culturale.
― 7 leggere min
Nuovi metodi nel Federated Learning migliorano la privacy e le prestazioni del modello mentre gestiscono dati diversi.
― 6 leggere min
CADE ottimizza le reti neurali a impulsi per migliorare le prestazioni e l'efficienza.
― 7 leggere min
Il modello Frieren migliora la qualità audio e la sincronizzazione per i video.
― 6 leggere min
Esplora le sfide di privacy sollevate dagli attacchi di inferenza nei modelli di machine learning.
― 8 leggere min
Scopri come MetaMixer trasforma l'efficienza e l'adattabilità dei modelli.
― 6 leggere min
Nuovi metodi di elaborazione migliorano il QIS per l'imaging in tempo reale.
― 6 leggere min
La ricerca mostra come i patch di attivazione influenzano la generazione di immagini nei modelli di diffusione.
― 7 leggere min
Ricerca su perturbazioni sintetiche per migliorare le mappe HD nelle auto a guida autonoma.
― 7 leggere min
DiffCut offre un nuovo modo di fare segmentazione delle immagini senza dati etichettati.
― 5 leggere min
Un framework per misurare e migliorare l'incertezza nei modelli di generazione delle immagini.
― 7 leggere min
Gear-NeRF migliora il rendering delle scene 3D dinamiche usando tecniche sensibili al movimento.
― 7 leggere min
Nuovi metodi rafforzano i watermark contro le minacce moderne di editing delle immagini.
― 8 leggere min
Scopri i sistemi di anti-spoofing facciale e quanto siano importanti nella sicurezza digitale.
― 5 leggere min
Presentiamo DOMA, un modello per prevedere il movimento in scene 3D.
― 7 leggere min
Il dataset sintetico Hi5 migliora il riconoscimento delle pose delle mani con immagini diverse.
― 8 leggere min
Un nuovo modo per recuperare i watermark da documenti danneggiati usando il deep learning.
― 7 leggere min