WebXR trasforma il modo in cui interagiamo con ambienti digitali immersivi.
― 9 leggere min
Scienza all'avanguardia spiegata semplicemente
WebXR trasforma il modo in cui interagiamo con ambienti digitali immersivi.
― 9 leggere min
Nuovo metodo migliora la sintesi vocale per le persone che non possono parlare.
― 7 leggere min
AniFrame rende l'arte della programmazione accessibile ai neofiti con un approccio facile da usare.
― 6 leggere min
Nuovo set di dati migliora la generazione di immagini da didascalie di notizie complesse.
― 7 leggere min
Un nuovo metodo migliora il fact-checking delle affermazioni sui social media.
― 7 leggere min
Shotit permette agli utenti di trovare video rapidamente usando le immagini, semplificando il processo di ricerca.
― 6 leggere min
Un nuovo sistema per migliorare le raccomandazioni senza dati precedenti.
― 7 leggere min
Pegasus-1 permette agli utenti di interagire con i video usando il linguaggio naturale.
― 7 leggere min
GaussianTalker offre una sincronizzazione labiale naturale e una qualità visiva alta per i video con persone che parlano.
― 6 leggere min
Un nuovo approccio permette alle macchine di identificare i personaggi dei fumetti senza addestramento precedente.
― 6 leggere min
Mimosa semplifica la creazione di audio spaziale per i video maker amatoriali.
― 8 leggere min
La sfida AIS 2024 cerca di migliorare le valutazioni della qualità video usando il deep learning.
― 6 leggere min
GaussianTalker trasforma l'interazione digitale con teste parlanti realistiche.
― 6 leggere min
I sottotitoli stanno diventando fondamentali per migliorare l'esperienza degli spettatori nei servizi di streaming.
― 8 leggere min
La ricerca introduce tecniche innovative per migliorare il rilevamento dei video deepfake.
― 6 leggere min
Un nuovo set di dati migliora il modo in cui i robot interpretano gli ambienti reali.
― 7 leggere min
UniAV combina localizzazione dell'azione, rilevamento del suono e localizzazione degli eventi audio-visivi per una migliore comprensione dei video.
― 8 leggere min
Un nuovo metodo migliora le prestazioni del rilevamento degli oggetti usando query adattive.
― 7 leggere min
Esplorare la capacità umana di identificare video deepfake rispetto al rilevamento da parte dell'IA.
― 7 leggere min
Esplorando come l'IA sta trasformando i processi di produzione video per i cineasti.
― 7 leggere min
PEAVS analizza quanto bene audio e video funzionano insieme per migliorare l'esperienza degli spettatori.
― 7 leggere min
CinePile sfida la comprensione di video lunghi con 305.000 domande diverse.
― 6 leggere min
Un nuovo metodo che protegge le immagini mediche nel cloud usando tecniche quantistiche avanzate.
― 8 leggere min
Un nuovo metodo migliora la precisione del tracciamento degli alimenti usando modelli 3D e immagini 2D.
― 6 leggere min
Questo studio mostra come il contesto migliori la comprensione delle immagini e delle domande da parte delle macchine.
― 7 leggere min
Un nuovo codec audio che offre una compressione di alta qualità e un contenuto semantico ricco.
― 6 leggere min
Uno studio presenta un nuovo metodo per creare video di facce parlate sincronizzate.
― 5 leggere min
Esplora come i modelli di linguaggio di grandi dimensioni migliorano la creatività attraverso la generazione multimediale.
― 7 leggere min
Esplorare i vantaggi del disegno 3D immersivo per architetti e designer.
― 6 leggere min
Presentiamo un modello che genera audio e video sincronizzati con livelli di rumore misti.
― 6 leggere min
Questo articolo parla di un nuovo modello semplice per generare audio dalle immagini e viceversa.
― 5 leggere min
Nuove tecniche migliorano la qualità e l'addestramento per le immagini 3D.
― 7 leggere min
NuNet usa dati RGB e di profondità per avere stime nutrizionali migliori.
― 6 leggere min
Un nuovo metodo migliora l'allineamento audio-video usando modelli già addestrati.
― 6 leggere min
Un nuovo metodo per migliorare i meccanismi di attenzione nella lavorazione di dati complessi.
― 7 leggere min
Esplorare come l'IA migliora lo streaming video promuovendo l'efficienza energetica.
― 6 leggere min
Il modello Frieren migliora la qualità audio e la sincronizzazione per i video.
― 6 leggere min
Gear-NeRF migliora il rendering delle scene 3D dinamiche usando tecniche sensibili al movimento.
― 7 leggere min
Nuovi metodi rafforzano i watermark contro le minacce moderne di editing delle immagini.
― 8 leggere min
Un nuovo sistema combina dati e notizie per una gestione migliore del rischio caldo.
― 6 leggere min