Informatica - Multimedia

RSS

Multimedia Collegare Emozioni nelle Immagini alla Ricerca Musicale

Un nuovo sistema collega immagini emotive alla musica per una scoperta migliore.

2025-09-21T16:37:05+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nella previsione del viewport per i video in streaming

MFTR migliora la precisione della previsione della viewport per esperienze video immersive.

2025-09-21T12:12:06+00:00 ― 6 leggere min

Interazione uomo-macchina Migliorare il controllo dei droni con la tecnologia dei gemelli digitali

Un sistema per rendere il controllo remoto degli UAV più sicuro e affidabile usando il Digital Twin.

2025-09-20T11:28:05+00:00 ― 6 leggere min

Ingegneria del software Affrontare il pregiudizio nei modelli di generazione di immagini

Un nuovo framework identifica e misura il bias nei sistemi di generazione di immagini.

2025-09-19T11:13:18+00:00 ― 9 leggere min

Visione artificiale e riconoscimento di modelli Miglioramenti nella Qualità delle Immagini con i Modelli di Diffusione

Esplora come i Modelli di Diffusione migliorano la super-risoluzione in vari campi.

2025-09-19T10:33:48+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli NU-Class Net: Migliorare la qualità video dopo la compressione

Un nuovo modello migliora i video a bassa qualità riducendo al contempo le richieste di elaborazione.

2025-09-19T05:25:42+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Un nuovo metodo per valutare la qualità di immagini e video

SAMA migliora la valutazione della qualità di immagini e video tramite tecniche di campionamento efficaci.

2025-09-19T00:33:24+00:00 ― 5 leggere min

Recupero delle informazioni Sfide nell'Imparare dai Video Musicali

Questo studio esamina le difficoltà nell'usare l'apprendimento contrastivo per comprendere i video musicali.

2025-09-18T17:21:45+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Rivoluzionare gli occhi dei personaggi nell'animazione

Un nuovo metodo semplifica il design degli occhi dei personaggi animati.

2025-09-18T14:01:24+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Avanzando la compressione delle immagini con l'analisi della frequenza

Un nuovo metodo migliora la compressione delle immagini concentrandosi sulle bande di frequenza.

2025-09-16T14:45:18+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Vlogger: Un Nuovo Strumento per Creare Video

Vlogger semplifica il video blogging, rendendo tutto più veloce e facile per i creatori.

2025-09-16T11:12:00+00:00 ― 6 leggere min

Multimedia I costi ambientali dello streaming video

Esaminando l'uso dell'energia e l'impatto dello streaming video sull'ambiente.

2025-09-16T01:59:00+00:00 ― 6 leggere min

Suono Nuovo modello migliora la valutazione dell'intensità di alimentazione dei pesci

Un approccio unificato per valutare l'alimentazione dei pesci usando dati audio e video.

2025-09-14T21:03:15+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli L'impatto dell'IA sulla tecnologia video

Scopri come l'IA sta cambiando la creazione e lo streaming di video.

2025-09-13T11:18:36+00:00 ― 6 leggere min

Elaborazione di immagini e video Presentiamo il Dataset di Videoconferenza per la Comunicazione nel Mondo Reale

Un dataset fatto apposta per testare la qualità video in situazioni di videoconferenza.

2025-09-13T03:45:30+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Nuovo framework collega video e testo in modo più efficace

I ricercatori hanno sviluppato un framework per capire meglio video e testo.

2025-09-12T20:49:36+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nelle Tecniche di Segmentazione Audio-Visiva

Un nuovo metodo migliora la segmentazione audio-visiva senza etichette dettagliate.

2025-09-12T20:28:15+00:00 ― 6 leggere min

Suono Nuovo sistema migliora l'estrazione della voce da posizioni della testa instabili

PIAVE aiuta le macchine a estrarre le voci in modo chiaro, anche quando i parlanti girano la testa.

2025-09-12T19:39:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato MusiLingo: Unire Musica e Lingua

Un nuovo sistema che collega musica e lingua per una comprensione migliore.

2025-09-11T14:30:40+00:00 ― 6 leggere min

Multimedia Progettazione di poster efficace tramite metriche semplici

Impara a progettare manifesti che comunicano messaggi in modo chiaro e attraente.

2025-09-09T08:49:24+00:00 ― 5 leggere min

Multimedia BDIQA: Avanzare nella risposta a domande sui video con la teoria della mente

Un nuovo dataset migliora la capacità dell'AI di interpretare il comportamento umano nei video.

2025-09-09T07:30:24+00:00 ― 7 leggere min

Interazione uomo-macchina Spica: Un Nuovo Strumento per Utenti Ciechi

Spica migliora l'accesso ai video per utenti non vedenti e ipovedenti tramite l'interattività.

2025-09-09T06:43:00+00:00 ― 5 leggere min

Robotica Testare i robot per sfide inaspettate

Esplorando metodi per migliorare le performance dei robot in ambienti imprevedibili.

2025-09-09T02:53:54+00:00 ― 5 leggere min

Suono Progressi nella tecnologia di conversione vocale usando immagini facciali

Un nuovo metodo trasforma le voci usando le caratteristiche facciali per diverse applicazioni.

2025-09-09T01:46:55+00:00 ― 9 leggere min

Elaborazione dell'audio e del parlato Presentiamo AV-SUPERB: un nuovo punto di riferimento per i modelli audio-visivi

AV-SUPERB valuta modelli audio e visivi su vari task per migliorare le prestazioni.

2025-09-08T22:32:35+00:00 ― 6 leggere min

Recupero delle informazioni Migliorare la ricerca video con tecniche moderne

Un nuovo metodo semplifica la ricerca di video combinando vari tipi di informazioni.

2025-09-08T20:50:30+00:00 ― 6 leggere min

Multimedia Creare macchine sensibili alle emozioni per una migliore interazione

Sviluppare macchine che rispondono in base alle emozioni per migliorare l'interazione tra umani e computer.

2025-09-08T19:31:30+00:00 ― 6 leggere min

Suono Generazione veloce di testo in audio usando la distillazione della coerenza

Nuovo metodo migliora la velocità e l'efficienza nella generazione da testo a audio.

2025-09-08T18:29:40+00:00 ― 4 leggere min

Visione artificiale e riconoscimento di modelli Tecniche Avanzate per la Localizzazione delle Sorgenti Sonore

Migliorare il modo in cui identifichiamo le fonti sonore usando dati audio-visivi.

2025-09-08T12:49:35+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Mappare i Suoni: Un Nuovo Approccio all'Analisi del Paesaggio Sonoro

Un metodo per visualizzare e prevedere suoni in vari ambienti usando tecnologia avanzata.

2025-09-08T11:12:25+00:00 ― 5 leggere min

Multimedia Green-LL: Migliorare l'esperienza di streaming video dal vivo

Un nuovo modo per migliorare la qualità dello streaming video live su mobile e l'efficienza energetica.

2025-09-08T06:13:36+00:00 ― 8 leggere min

Recupero delle informazioni Raccomandazioni Alimentari Personalizzate con ChatDiet

ChatDiet combina dati personali e conoscenze della popolazione per darti consigli alimentari migliori.

2025-09-07T00:28:12+00:00 ― 8 leggere min

Multimedia Televisione: Uno Sguardo più Da Vicino su Pregiudizi e Civiltà

Un'analisi dei pregiudizi e della mancanza di civiltà nei dibattiti televisivi indiani.

2025-09-06T18:16:54+00:00 ― 6 leggere min

Elaborazione di immagini e video Progressi nelle tecniche di compressione video

Nuovo framework migliora l'efficienza e la qualità della compressione video.

2025-09-06T14:40:20+00:00 ― 6 leggere min

Interazione uomo-macchina Il Ruolo dei Media Visivi nella Propaganda

Questo articolo esplora come le immagini hanno influenzato l'opinione pubblica durante il conflitto Russia-Ucraina.

2025-09-05T06:04:24+00:00 ― 4 leggere min

Elaborazione di immagini e video Migliorare la trasmissione di immagini wireless in ambienti rumorosi

Un nuovo metodo migliora la qualità delle immagini durante la trasmissione wireless su canali rumorosi.

2025-09-05T03:18:04+00:00 ― 5 leggere min

Computer e società MemeCraft: Un Nuovo Strumento per l'Advocacy Sociale

MemeCraft crea meme coinvolgenti per promuovere cause sociali in sicurezza.

2025-09-04T14:48:00+00:00 ― 11 leggere min

Visione artificiale e riconoscimento di modelli Migliorare l'apprendimento audio-visivo con la co-augmentazione della velocità

Un nuovo metodo migliora l'apprendimento automatico dei dati audio-visivi.

2025-09-04T05:59:30+00:00 ― 6 leggere min

Calcolo e linguaggio RVS Compito: Un Nuovo Modo di Dare Direzioni

La ricerca mostra modi più ampi per dare indicazioni usando la conoscenza spaziale.

2025-09-03T23:39:30+00:00 ― 8 leggere min

Elaborazione del segnale Un Nuovo Approccio per Identificare i Sintomi della Schizofrenia

Combinare audio, video e testo per valutazioni della salute mentale migliori.

2025-09-03T22:42:15+00:00 ― 6 leggere min