Un nuovo metodo migliora le prestazioni del rilevamento degli oggetti usando query adattive.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo metodo migliora le prestazioni del rilevamento degli oggetti usando query adattive.
― 7 leggere min
Esplorare la capacità umana di identificare video deepfake rispetto al rilevamento da parte dell'IA.
― 7 leggere min
Esplorando come l'IA sta trasformando i processi di produzione video per i cineasti.
― 7 leggere min
PEAVS analizza quanto bene audio e video funzionano insieme per migliorare l'esperienza degli spettatori.
― 7 leggere min
CinePile sfida la comprensione di video lunghi con 305.000 domande diverse.
― 6 leggere min
Un nuovo metodo che protegge le immagini mediche nel cloud usando tecniche quantistiche avanzate.
― 8 leggere min
Un nuovo metodo migliora la precisione del tracciamento degli alimenti usando modelli 3D e immagini 2D.
― 6 leggere min
Questo studio mostra come il contesto migliori la comprensione delle immagini e delle domande da parte delle macchine.
― 7 leggere min
Un nuovo codec audio che offre una compressione di alta qualità e un contenuto semantico ricco.
― 6 leggere min
Uno studio presenta un nuovo metodo per creare video di facce parlate sincronizzate.
― 5 leggere min
Esplora come i modelli di linguaggio di grandi dimensioni migliorano la creatività attraverso la generazione multimediale.
― 7 leggere min
Esplorare i vantaggi del disegno 3D immersivo per architetti e designer.
― 6 leggere min
Presentiamo un modello che genera audio e video sincronizzati con livelli di rumore misti.
― 6 leggere min
Questo articolo parla di un nuovo modello semplice per generare audio dalle immagini e viceversa.
― 5 leggere min
Nuove tecniche migliorano la qualità e l'addestramento per le immagini 3D.
― 7 leggere min
NuNet usa dati RGB e di profondità per avere stime nutrizionali migliori.
― 6 leggere min
Un nuovo metodo migliora l'allineamento audio-video usando modelli già addestrati.
― 6 leggere min
Un nuovo metodo per migliorare i meccanismi di attenzione nella lavorazione di dati complessi.
― 7 leggere min
Esplorare come l'IA migliora lo streaming video promuovendo l'efficienza energetica.
― 6 leggere min
Il modello Frieren migliora la qualità audio e la sincronizzazione per i video.
― 6 leggere min
Gear-NeRF migliora il rendering delle scene 3D dinamiche usando tecniche sensibili al movimento.
― 7 leggere min
Nuovi metodi rafforzano i watermark contro le minacce moderne di editing delle immagini.
― 8 leggere min
Un nuovo sistema combina dati e notizie per una gestione migliore del rischio caldo.
― 6 leggere min
Un nuovo metodo per creare musica che si adatta in modo efficace ai contenuti video.
― 8 leggere min
Un recente studio ripete risultati chiave sull'interpretazione dei dati usando suoni e immagini.
― 6 leggere min
Il nuovo modello genera musica usando sia informazioni testuali che visive.
― 7 leggere min
Combinare generazione di immagini e recupero per un accesso migliore alle informazioni visive.
― 7 leggere min
Uno sguardo ai nuovi metodi per capire il parlato sovrapposto durante le conversazioni.
― 8 leggere min
Un nuovo metodo per rilevare le notizie fuori contesto in modo efficiente.
― 4 leggere min
PianoMotion10M offre movimenti delle mani dettagliati per aiutare chi impara a suonare il pianoforte.
― 6 leggere min
Esplorare come le misure di QoE migliorano la soddisfazione dei servizi multimediali.
― 9 leggere min
Questo studio esamina i metodi audio per tracciare i movimenti dei pedoni nelle aree urbane.
― 7 leggere min
Un nuovo dataset migliora la creazione di audio foley per contenuti multimediali.
― 6 leggere min
Un progetto mescola danza e tecnologia per esprimere creatività.
― 6 leggere min
Nuovo metodo migliora l'analisi video della colonscopia per la rilevazione di polipi.
― 7 leggere min
Un metodo per migliorare l'identificazione delle fake news usando le interazioni sui social media.
― 7 leggere min
VCEval offre un modo automatico per valutare l'efficacia dei corsi online.
― 5 leggere min
Un approccio multimodale migliora il modo in cui si identificano i momenti salienti nei live stream.
― 6 leggere min
Questo documento presenta un sistema per creare immagini che rispondono alla musica.
― 7 leggere min
Un nuovo metodo migliora il recupero di immagini e testi in più lingue.
― 6 leggere min