Un nuovo codec audio che offre una compressione di alta qualità e un contenuto semantico ricco.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo codec audio che offre una compressione di alta qualità e un contenuto semantico ricco.
― 6 leggere min
Articoli più recenti
Nuove tecniche migliorano la qualità e l'addestramento per le immagini 3D.
― 7 leggere min
NuNet usa dati RGB e di profondità per avere stime nutrizionali migliori.
― 6 leggere min
Un nuovo metodo migliora l'allineamento audio-video usando modelli già addestrati.
― 6 leggere min
Un nuovo metodo per migliorare i meccanismi di attenzione nella lavorazione di dati complessi.
― 7 leggere min
Esplorare come l'IA migliora lo streaming video promuovendo l'efficienza energetica.
― 6 leggere min
Il modello Frieren migliora la qualità audio e la sincronizzazione per i video.
― 6 leggere min
Gear-NeRF migliora il rendering delle scene 3D dinamiche usando tecniche sensibili al movimento.
― 7 leggere min
Nuovi metodi rafforzano i watermark contro le minacce moderne di editing delle immagini.
― 8 leggere min
Un nuovo sistema combina dati e notizie per una gestione migliore del rischio caldo.
― 6 leggere min
Un nuovo metodo per creare musica che si adatta in modo efficace ai contenuti video.
― 8 leggere min
Un recente studio ripete risultati chiave sull'interpretazione dei dati usando suoni e immagini.
― 6 leggere min
Il nuovo modello genera musica usando sia informazioni testuali che visive.
― 7 leggere min
Combinare generazione di immagini e recupero per un accesso migliore alle informazioni visive.
― 7 leggere min
Uno sguardo ai nuovi metodi per capire il parlato sovrapposto durante le conversazioni.
― 8 leggere min
Un nuovo metodo per rilevare le notizie fuori contesto in modo efficiente.
― 4 leggere min
PianoMotion10M offre movimenti delle mani dettagliati per aiutare chi impara a suonare il pianoforte.
― 6 leggere min
Esplorare come le misure di QoE migliorano la soddisfazione dei servizi multimediali.
― 9 leggere min
Questo studio esamina i metodi audio per tracciare i movimenti dei pedoni nelle aree urbane.
― 7 leggere min
Un nuovo dataset migliora la creazione di audio foley per contenuti multimediali.
― 6 leggere min
Un progetto mescola danza e tecnologia per esprimere creatività.
― 6 leggere min
Nuovo metodo migliora l'analisi video della colonscopia per la rilevazione di polipi.
― 7 leggere min
Un metodo per migliorare l'identificazione delle fake news usando le interazioni sui social media.
― 7 leggere min
VCEval offre un modo automatico per valutare l'efficacia dei corsi online.
― 5 leggere min
Un approccio multimodale migliora il modo in cui si identificano i momenti salienti nei live stream.
― 6 leggere min
Questo documento presenta un sistema per creare immagini che rispondono alla musica.
― 7 leggere min
Un nuovo metodo migliora il recupero di immagini e testi in più lingue.
― 6 leggere min
Scopri come i modelli di diffusione stanno rivoluzionando il video editing grazie alla tecnologia AI.
― 5 leggere min
La ricerca mostra che l'incoerenza tra testo e immagine aumenta con la popolarità dei post sui social.
― 5 leggere min
Nuovo dataset migliora la generazione audio da descrizioni testuali dettagliate.
― 5 leggere min
Un nuovo strumento per testare i modelli linguistici in ambienti rumorosi.
― 4 leggere min
Un nuovo metodo per creare mesh di riferimento più pulite da forme 3D dinamiche.
― 6 leggere min
Un nuovo metodo riduce la necessità di dati etichettati nei compiti di visione artificiale.
― 6 leggere min
Questo articolo presenta un metodo per generare suoni precisi da video e testo.
― 7 leggere min
Presentiamo un nuovo modello che combina in modo efficiente testo e layout per una migliore comprensione dei documenti.
― 5 leggere min
Un nuovo metodo migliora la gestione dei dati video per una comprensione e un'efficienza migliori.
― 5 leggere min
Il dataset AMEX migliora la comprensione dell'IA sulle interfacce delle app mobili.
― 7 leggere min
Presentiamo i dataset MERGE per migliorare la classificazione delle emozioni nella musica.
― 6 leggere min
Esplorare come i videogiochi possano insegnare abilità di programmazione essenziali in modo efficace e coinvolgente.
― 5 leggere min
Unire suoni e immagini per sistemi di riconoscimento più intelligenti.
― 7 leggere min
VCoME aiuta gli utenti a creare video verbali coinvolgenti facilmente.
― 5 leggere min