Informatica - Multimedia

RSS

Visione artificiale e riconoscimento di modelli Avanzando la compressione delle immagini con l'analisi della frequenza

Un nuovo metodo migliora la compressione delle immagini concentrandosi sulle bande di frequenza.

2025-09-16T14:45:18+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Vlogger: Un Nuovo Strumento per Creare Video

Vlogger semplifica il video blogging, rendendo tutto più veloce e facile per i creatori.

2025-09-16T11:12:00+00:00 ― 6 leggere min

Multimedia I costi ambientali dello streaming video

Esaminando l'uso dell'energia e l'impatto dello streaming video sull'ambiente.

2025-09-16T01:59:00+00:00 ― 6 leggere min

Suono Nuovo modello migliora la valutazione dell'intensità di alimentazione dei pesci

Un approccio unificato per valutare l'alimentazione dei pesci usando dati audio e video.

2025-09-14T21:03:15+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli L'impatto dell'IA sulla tecnologia video

Scopri come l'IA sta cambiando la creazione e lo streaming di video.

2025-09-13T11:18:36+00:00 ― 6 leggere min

Elaborazione di immagini e video Presentiamo il Dataset di Videoconferenza per la Comunicazione nel Mondo Reale

Un dataset fatto apposta per testare la qualità video in situazioni di videoconferenza.

2025-09-13T03:45:30+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Nuovo framework collega video e testo in modo più efficace

I ricercatori hanno sviluppato un framework per capire meglio video e testo.

2025-09-12T20:49:36+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nelle Tecniche di Segmentazione Audio-Visiva

Un nuovo metodo migliora la segmentazione audio-visiva senza etichette dettagliate.

2025-09-12T20:28:15+00:00 ― 6 leggere min

Suono Nuovo sistema migliora l'estrazione della voce da posizioni della testa instabili

PIAVE aiuta le macchine a estrarre le voci in modo chiaro, anche quando i parlanti girano la testa.

2025-09-12T19:39:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato MusiLingo: Unire Musica e Lingua

Un nuovo sistema che collega musica e lingua per una comprensione migliore.

2025-09-11T14:30:40+00:00 ― 6 leggere min

Multimedia Progettazione di poster efficace tramite metriche semplici

Impara a progettare manifesti che comunicano messaggi in modo chiaro e attraente.

2025-09-09T08:49:24+00:00 ― 5 leggere min

Multimedia BDIQA: Avanzare nella risposta a domande sui video con la teoria della mente

Un nuovo dataset migliora la capacità dell'AI di interpretare il comportamento umano nei video.

2025-09-09T07:30:24+00:00 ― 7 leggere min

Interazione uomo-macchina Spica: Un Nuovo Strumento per Utenti Ciechi

Spica migliora l'accesso ai video per utenti non vedenti e ipovedenti tramite l'interattività.

2025-09-09T06:43:00+00:00 ― 5 leggere min

Robotica Testare i robot per sfide inaspettate

Esplorando metodi per migliorare le performance dei robot in ambienti imprevedibili.

2025-09-09T02:53:54+00:00 ― 5 leggere min

Suono Progressi nella tecnologia di conversione vocale usando immagini facciali

Un nuovo metodo trasforma le voci usando le caratteristiche facciali per diverse applicazioni.

2025-09-09T01:46:55+00:00 ― 9 leggere min

Elaborazione dell'audio e del parlato Presentiamo AV-SUPERB: un nuovo punto di riferimento per i modelli audio-visivi

AV-SUPERB valuta modelli audio e visivi su vari task per migliorare le prestazioni.

2025-09-08T22:32:35+00:00 ― 6 leggere min

Recupero delle informazioni Migliorare la ricerca video con tecniche moderne

Un nuovo metodo semplifica la ricerca di video combinando vari tipi di informazioni.

2025-09-08T20:50:30+00:00 ― 6 leggere min

Multimedia Creare macchine sensibili alle emozioni per una migliore interazione

Sviluppare macchine che rispondono in base alle emozioni per migliorare l'interazione tra umani e computer.

2025-09-08T19:31:30+00:00 ― 6 leggere min

Suono Generazione veloce di testo in audio usando la distillazione della coerenza

Nuovo metodo migliora la velocità e l'efficienza nella generazione da testo a audio.

2025-09-08T18:29:40+00:00 ― 4 leggere min

Visione artificiale e riconoscimento di modelli Tecniche Avanzate per la Localizzazione delle Sorgenti Sonore

Migliorare il modo in cui identifichiamo le fonti sonore usando dati audio-visivi.

2025-09-08T12:49:35+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Mappare i Suoni: Un Nuovo Approccio all'Analisi del Paesaggio Sonoro

Un metodo per visualizzare e prevedere suoni in vari ambienti usando tecnologia avanzata.

2025-09-08T11:12:25+00:00 ― 5 leggere min

Multimedia Green-LL: Migliorare l'esperienza di streaming video dal vivo

Un nuovo modo per migliorare la qualità dello streaming video live su mobile e l'efficienza energetica.

2025-09-08T06:13:36+00:00 ― 8 leggere min

Recupero delle informazioni Raccomandazioni Alimentari Personalizzate con ChatDiet

ChatDiet combina dati personali e conoscenze della popolazione per darti consigli alimentari migliori.

2025-09-07T00:28:12+00:00 ― 8 leggere min

Multimedia Televisione: Uno Sguardo più Da Vicino su Pregiudizi e Civiltà

Un'analisi dei pregiudizi e della mancanza di civiltà nei dibattiti televisivi indiani.

2025-09-06T18:16:54+00:00 ― 6 leggere min

Elaborazione di immagini e video Progressi nelle tecniche di compressione video

Nuovo framework migliora l'efficienza e la qualità della compressione video.

2025-09-06T14:40:20+00:00 ― 6 leggere min

Interazione uomo-macchina Il Ruolo dei Media Visivi nella Propaganda

Questo articolo esplora come le immagini hanno influenzato l'opinione pubblica durante il conflitto Russia-Ucraina.

2025-09-05T06:04:24+00:00 ― 4 leggere min

Elaborazione di immagini e video Migliorare la trasmissione di immagini wireless in ambienti rumorosi

Un nuovo metodo migliora la qualità delle immagini durante la trasmissione wireless su canali rumorosi.

2025-09-05T03:18:04+00:00 ― 5 leggere min

Computer e società MemeCraft: Un Nuovo Strumento per l'Advocacy Sociale

MemeCraft crea meme coinvolgenti per promuovere cause sociali in sicurezza.

2025-09-04T14:48:00+00:00 ― 11 leggere min

Visione artificiale e riconoscimento di modelli Migliorare l'apprendimento audio-visivo con la co-augmentazione della velocità

Un nuovo metodo migliora l'apprendimento automatico dei dati audio-visivi.

2025-09-04T05:59:30+00:00 ― 6 leggere min

Calcolo e linguaggio RVS Compito: Un Nuovo Modo di Dare Direzioni

La ricerca mostra modi più ampi per dare indicazioni usando la conoscenza spaziale.

2025-09-03T23:39:30+00:00 ― 8 leggere min

Elaborazione del segnale Un Nuovo Approccio per Identificare i Sintomi della Schizofrenia

Combinare audio, video e testo per valutazioni della salute mentale migliori.

2025-09-03T22:42:15+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nella tecnologia di generazione di volti parlanti

Nuovo framework migliora la sincronizzazione labiale e la qualità visiva nei video di volti che parlano.

2025-09-03T04:02:24+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Avanzare nella rilevazione dei difetti con campioni sintetici

Un nuovo metodo genera campioni difettosi fake per migliorare il rilevamento delle anomalie nella produzione.

2025-09-02T21:51:06+00:00 ― 6 leggere min

Suono Combinare Voce e Viso per una Migliore Identificazione

Nuovo metodo migliora la verifica dell'identità degli speaker unendo dati audio e visivi.

2025-09-02T07:50:15+00:00 ― 5 leggere min

Multimedia Avanzamenti nella localizzazione degli altoparlanti audio-visivi

Un nuovo metodo migliora il tracciamento degli speaker usando dati audio e visivi.

2025-09-02T06:13:05+00:00 ― 7 leggere min

Suono Un nuovo modello per la generazione di musica con l'IA

MusicAOG semplifica la creazione e la comprensione della musica tramite un'innovativa rappresentazione grafica.

2025-08-31T08:52:25+00:00 ― 6 leggere min

Interazione uomo-macchina L'importanza delle emozioni non tipiche

Analizzare lo stress e la depressione può migliorare la nostra comprensione della salute mentale.

2025-08-31T02:02:36+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Rilevare l'umorismo nei video con FunnyNet-W

Un nuovo modello identifica i momenti divertenti nei video usando dati visivi, audio e di testo.

2025-08-30T23:09:25+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli AesopAgent: Trasformare Storie in Video

AesopAgent permette agli utenti di creare video da storie usando strumenti AI avanzati.

2025-08-30T18:32:18+00:00 ― 5 leggere min

Interazione uomo-macchina Il Ruolo delle Immagini nell'Apprendimento su Wikipedia

Esaminando come le immagini influenzano l'apprendimento negli articoli di Wikipedia.

2025-08-30T02:28:30+00:00 ― 6 leggere min