La ricerca sviluppa un modello per misurare con precisione l'engagement nelle conversazioni.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
La ricerca sviluppa un modello per misurare con precisione l'engagement nelle conversazioni.
― 6 leggere min
Un nuovo modo per proteggere le immagini RAW da manipolazioni.
― 5 leggere min
Nuovo set di dati e metodi migliorano l'accuratezza nel rispondere a domande sui video.
― 7 leggere min
Il framework UniSA unifica i compiti nell'analisi del sentiment per un riconoscimento delle emozioni migliore.
― 5 leggere min
Un metodo che usa le girate della testa inganna con successo i sistemi di rilevamento dei deepfake.
― 5 leggere min
Un framework per un'adattamento efficace di modelli di linguaggio multimodali.
― 5 leggere min
Usare prototipi per migliorare il confronto dei dataset nella visione artificiale.
― 8 leggere min
Un programma che genera tipografia visivamente accattivante su misura per il contesto.
― 4 leggere min
MusicLDM trasforma il testo in musica originale, offrendo nuove strade per la creatività.
― 7 leggere min
Nuovi metodi migliorano l'accuratezza nell'estrazione delle melodie cantate da audio misti.
― 7 leggere min
Nuovi metodi puntano a migliorare il captioning audio per una maggiore precisione ed efficienza.
― 5 leggere min
Nuove tecniche migliorano la valutazione della qualità dei sottotitoli audio attraverso il rilevamento automatico degli errori.
― 6 leggere min
Questo studio esplora i metodi di classificazione della qualità della voce e il loro significato nella comunicazione.
― 5 leggere min
La steganalisi aiuta a scoprire messaggi nascosti nei multimedia, garantendo comunicazioni sicure.
― 4 leggere min
Trasformare i gesti per agenti virtuali mantenendo il significato.
― 6 leggere min
Un metodo che usa audio e video per migliorare la rilevazione dei deepfake.
― 4 leggere min
Un nuovo metodo crea gesti realistici a partire da audio vocale grezzo.
― 5 leggere min
Un nuovo metodo per generare gesti che si abbinano efficacemente al parlato.
― 7 leggere min
Riconoscere la soggettività nelle notizie è fondamentale per avere informazioni accurate.
― 6 leggere min
VEATIC offre un dataset più ricco per studiare le emozioni umane nel contesto.
― 7 leggere min
Valutare il realismo e la qualità dei video generati dal testo.
― 6 leggere min
Un nuovo metodo migliora la compressione delle immagini per vari tipi di immagini.
― 7 leggere min
Questo articolo parla del bias nella lunghezza dei frame nel recupero testo-video e di un nuovo approccio per affrontarlo.
― 6 leggere min
Un nuovo metodo migliora il modo in cui la tecnologia rileva il comportamento umano nei contesti di gruppo.
― 5 leggere min
Scopri come LP-CLIP rinforza la robustezza dei modelli multimodali tipo CLIP.
― 5 leggere min
Un dataset rivoluzionario aiuta lo studio della traduzione dei testi del K-pop.
― 8 leggere min
AVMIT offre ai ricercatori spunti su come suono e visione si collegano nel riconoscimento delle azioni.
― 6 leggere min
Un nuovo metodo migliora il rilevamento di audio falso nei sistemi di riconoscimento vocale.
― 6 leggere min
Questo studio esplora come il ritaglio possa migliorare il richiamo video concentrandosi sulla salienza visiva.
― 5 leggere min
Valutare modelli grandi su compiti visivi di basso livello tramite Q-Bench.
― 5 leggere min
Un nuovo metodo migliora le registrazioni audio usando indizi visivi.
― 6 leggere min
Esplorare l'impatto dei contenuti generati dall'IA sull'arte del raccontare storie.
― 7 leggere min
Un nuovo sistema collega immagini emotive alla musica per una scoperta migliore.
― 6 leggere min
MFTR migliora la precisione della previsione della viewport per esperienze video immersive.
― 6 leggere min
Un sistema per rendere il controllo remoto degli UAV più sicuro e affidabile usando il Digital Twin.
― 6 leggere min
Un nuovo framework identifica e misura il bias nei sistemi di generazione di immagini.
― 9 leggere min
Esplora come i Modelli di Diffusione migliorano la super-risoluzione in vari campi.
― 6 leggere min
Un nuovo modello migliora i video a bassa qualità riducendo al contempo le richieste di elaborazione.
― 8 leggere min
SAMA migliora la valutazione della qualità di immagini e video tramite tecniche di campionamento efficaci.
― 5 leggere min
Questo studio esamina le difficoltà nell'usare l'apprendimento contrastivo per comprendere i video musicali.
― 6 leggere min