Un nuovo modello identifica i momenti divertenti nei video usando dati visivi, audio e di testo.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo modello identifica i momenti divertenti nei video usando dati visivi, audio e di testo.
― 6 leggere min
AesopAgent permette agli utenti di creare video da storie usando strumenti AI avanzati.
― 5 leggere min
Esaminando come le immagini influenzano l'apprendimento negli articoli di Wikipedia.
― 6 leggere min
Un metodo per ridurre la ridondanza nelle rappresentazioni di dati multi-view.
― 6 leggere min
CoAVT integra dati audio, visivi e testuali per una comprensione migliore.
― 8 leggere min
Crea video con avatar parlanti facilmente con il sistema innovativo di Virbo.
― 7 leggere min
Il dataset WiMANS permette di tracciare le attività di più utenti usando i segnali WiFi.
― 7 leggere min
Un nuovo framework semplifica i compiti di video editing usando strumenti di fotoritocco.
― 9 leggere min
BDoG migliora il ragionamento dell'IA integrando vari tipi di dati in modo efficace.
― 7 leggere min
Eracle combina trasformatori e modelli di stato per migliorare l'elaborazione dei dati.
― 6 leggere min
Un nuovo metodo integra informazioni acustiche nei modelli linguistici per una migliore riconoscimento vocale.
― 9 leggere min
Usare la musica per spiegare il cancro può migliorare la comprensione e il coinvolgimento.
― 7 leggere min
Un nuovo framework migliora il completamento dei grafi di conoscenza con diversi tipi di dati.
― 8 leggere min
Un nuovo modo per animare ritratti con espressioni e angolazioni che cambiano.
― 7 leggere min
Nuovo metodo migliora la compressione dei dati 3D mantenendo la qualità.
― 9 leggere min
CIRP migliora la rappresentazione degli articoli per un migliore bundling dei prodotti online.
― 8 leggere min
Esplorando come l'IoS potrebbe trasformare le nostre esperienze digitali coinvolgendo tutti i sensi.
― 11 leggere min
DIBS migliora i sottotitoli degli eventi video perfezionando i confini usando dati non etichettati.
― 8 leggere min
Combinare immagini e testo migliora l'accuratezza nella stima della profondità 3D.
― 7 leggere min
WebXR trasforma il modo in cui interagiamo con ambienti digitali immersivi.
― 9 leggere min
Nuovo metodo migliora la sintesi vocale per le persone che non possono parlare.
― 7 leggere min
AniFrame rende l'arte della programmazione accessibile ai neofiti con un approccio facile da usare.
― 6 leggere min
Nuovo set di dati migliora la generazione di immagini da didascalie di notizie complesse.
― 7 leggere min
Un nuovo metodo migliora il fact-checking delle affermazioni sui social media.
― 7 leggere min
Shotit permette agli utenti di trovare video rapidamente usando le immagini, semplificando il processo di ricerca.
― 6 leggere min
Un nuovo sistema per migliorare le raccomandazioni senza dati precedenti.
― 7 leggere min
Pegasus-1 permette agli utenti di interagire con i video usando il linguaggio naturale.
― 7 leggere min
GaussianTalker offre una sincronizzazione labiale naturale e una qualità visiva alta per i video con persone che parlano.
― 6 leggere min
Un nuovo approccio permette alle macchine di identificare i personaggi dei fumetti senza addestramento precedente.
― 6 leggere min
Mimosa semplifica la creazione di audio spaziale per i video maker amatoriali.
― 8 leggere min
La sfida AIS 2024 cerca di migliorare le valutazioni della qualità video usando il deep learning.
― 6 leggere min
GaussianTalker trasforma l'interazione digitale con teste parlanti realistiche.
― 6 leggere min
I sottotitoli stanno diventando fondamentali per migliorare l'esperienza degli spettatori nei servizi di streaming.
― 8 leggere min
La ricerca introduce tecniche innovative per migliorare il rilevamento dei video deepfake.
― 6 leggere min
Un nuovo set di dati migliora il modo in cui i robot interpretano gli ambienti reali.
― 7 leggere min
UniAV combina localizzazione dell'azione, rilevamento del suono e localizzazione degli eventi audio-visivi per una migliore comprensione dei video.
― 8 leggere min
Un nuovo metodo migliora le prestazioni del rilevamento degli oggetti usando query adattive.
― 7 leggere min
Esplorare la capacità umana di identificare video deepfake rispetto al rilevamento da parte dell'IA.
― 7 leggere min
Esplorando come l'IA sta trasformando i processi di produzione video per i cineasti.
― 7 leggere min
PEAVS analizza quanto bene audio e video funzionano insieme per migliorare l'esperienza degli spettatori.
― 7 leggere min