Questo studio esplora come il ritaglio possa migliorare il richiamo video concentrandosi sulla salienza visiva.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
Questo studio esplora come il ritaglio possa migliorare il richiamo video concentrandosi sulla salienza visiva.
― 5 leggere min
Articoli più recenti
Articoli più recenti
Un sistema per rendere il controllo remoto degli UAV più sicuro e affidabile usando il Digital Twin.
― 6 leggere min
Un nuovo framework identifica e misura il bias nei sistemi di generazione di immagini.
― 9 leggere min
Esplora come i Modelli di Diffusione migliorano la super-risoluzione in vari campi.
― 6 leggere min
Un nuovo modello migliora i video a bassa qualità riducendo al contempo le richieste di elaborazione.
― 8 leggere min
SAMA migliora la valutazione della qualità di immagini e video tramite tecniche di campionamento efficaci.
― 5 leggere min
Questo studio esamina le difficoltà nell'usare l'apprendimento contrastivo per comprendere i video musicali.
― 6 leggere min
Un nuovo metodo semplifica il design degli occhi dei personaggi animati.
― 6 leggere min
Un nuovo metodo migliora la compressione delle immagini concentrandosi sulle bande di frequenza.
― 6 leggere min
Vlogger semplifica il video blogging, rendendo tutto più veloce e facile per i creatori.
― 6 leggere min
Esaminando l'uso dell'energia e l'impatto dello streaming video sull'ambiente.
― 6 leggere min
Un approccio unificato per valutare l'alimentazione dei pesci usando dati audio e video.
― 5 leggere min
Scopri come l'IA sta cambiando la creazione e lo streaming di video.
― 6 leggere min
Un dataset fatto apposta per testare la qualità video in situazioni di videoconferenza.
― 6 leggere min
I ricercatori hanno sviluppato un framework per capire meglio video e testo.
― 6 leggere min
Un nuovo metodo migliora la segmentazione audio-visiva senza etichette dettagliate.
― 6 leggere min
PIAVE aiuta le macchine a estrarre le voci in modo chiaro, anche quando i parlanti girano la testa.
― 6 leggere min
Un nuovo sistema che collega musica e lingua per una comprensione migliore.
― 6 leggere min
Impara a progettare manifesti che comunicano messaggi in modo chiaro e attraente.
― 5 leggere min
Un nuovo dataset migliora la capacità dell'AI di interpretare il comportamento umano nei video.
― 7 leggere min
Spica migliora l'accesso ai video per utenti non vedenti e ipovedenti tramite l'interattività.
― 5 leggere min
Esplorando metodi per migliorare le performance dei robot in ambienti imprevedibili.
― 5 leggere min
Un nuovo metodo trasforma le voci usando le caratteristiche facciali per diverse applicazioni.
― 9 leggere min
AV-SUPERB valuta modelli audio e visivi su vari task per migliorare le prestazioni.
― 6 leggere min
Un nuovo metodo semplifica la ricerca di video combinando vari tipi di informazioni.
― 6 leggere min
Sviluppare macchine che rispondono in base alle emozioni per migliorare l'interazione tra umani e computer.
― 6 leggere min
Nuovo metodo migliora la velocità e l'efficienza nella generazione da testo a audio.
― 4 leggere min
Migliorare il modo in cui identifichiamo le fonti sonore usando dati audio-visivi.
― 7 leggere min
Un metodo per visualizzare e prevedere suoni in vari ambienti usando tecnologia avanzata.
― 5 leggere min
Un nuovo modo per migliorare la qualità dello streaming video live su mobile e l'efficienza energetica.
― 8 leggere min
ChatDiet combina dati personali e conoscenze della popolazione per darti consigli alimentari migliori.
― 8 leggere min
Un'analisi dei pregiudizi e della mancanza di civiltà nei dibattiti televisivi indiani.
― 6 leggere min
Nuovo framework migliora l'efficienza e la qualità della compressione video.
― 6 leggere min
Questo articolo esplora come le immagini hanno influenzato l'opinione pubblica durante il conflitto Russia-Ucraina.
― 4 leggere min
Un nuovo metodo migliora la qualità delle immagini durante la trasmissione wireless su canali rumorosi.
― 5 leggere min
MemeCraft crea meme coinvolgenti per promuovere cause sociali in sicurezza.
― 11 leggere min
Un nuovo metodo migliora l'apprendimento automatico dei dati audio-visivi.
― 6 leggere min
La ricerca mostra modi più ampi per dare indicazioni usando la conoscenza spaziale.
― 8 leggere min
Combinare audio, video e testo per valutazioni della salute mentale migliori.
― 6 leggere min
Nuovo framework migliora la sincronizzazione labiale e la qualità visiva nei video di volti che parlano.
― 5 leggere min
Un nuovo metodo genera campioni difettosi fake per migliorare il rilevamento delle anomalie nella produzione.
― 6 leggere min