Informatica - Multimedia

RSS

Multimedia Avanzamenti nella stima dell'engagement per le conversazioni

La ricerca sviluppa un modello per misurare con precisione l'engagement nelle conversazioni.

2025-10-01T21:57:50+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Proteggere l'Autenticità: Il Metodo DRAW per Immagini RAW

Un nuovo modo per proteggere le immagini RAW da manipolazioni.

2025-10-01T10:37:40+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Capire il VideoQA: Sfide e Soluzioni

Nuovo set di dati e metodi migliorano l'accuratezza nel rispondere a domande sui video.

2025-10-01T06:57:48+00:00 ― 7 leggere min

Calcolo e linguaggio Avanzando l'analisi del sentiment con il framework UniSA

Il framework UniSA unifica i compiti nell'analisi del sentiment per un riconoscimento delle emozioni migliore.

2025-10-01T06:18:18+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Nuove tecniche ingannano i rilevatori di deepfake

Un metodo che usa le girate della testa inganna con successo i sistemi di rilevamento dei deepfake.

2025-10-01T02:45:00+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Presentiamo l'Adapter MultiWay per modelli multimodali

Un framework per un'adattamento efficace di modelli di linguaggio multimodali.

2025-10-01T01:18:06+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Un Approccio Comparativo all'Ispezione dei Dataset

Usare prototipi per migliorare il confronto dei dataset nella visione artificiale.

2025-09-30T09:38:00+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Design tipografico automatizzato per una comunicazione efficace

Un programma che genera tipografia visivamente accattivante su misura per il contesto.

2025-09-30T06:28:24+00:00 ― 4 leggere min

Suono MusicLDM: Un Nuovo Approccio alla Generazione di Musica da Testo

MusicLDM trasforma il testo in musica originale, offrendo nuove strade per la creatività.

2025-09-30T05:28:40+00:00 ― 7 leggere min

Suono Migliorare le tecniche di estrazione della melodia cantata con il deep learning

Nuovi metodi migliorano l'accuratezza nell'estrazione delle melodie cantate da audio misti.

2025-09-30T01:25:45+00:00 ― 7 leggere min

Calcolo e linguaggio Sviluppi nella tecnologia dei sottotitoli audio

Nuovi metodi puntano a migliorare il captioning audio per una maggiore precisione ed efficienza.

2025-09-30T00:25:00+00:00 ― 5 leggere min

Multimedia Migliorare i Metodi di Valutazione delle Didascalie Audio

Nuove tecniche migliorano la valutazione della qualità dei sottotitoli audio attraverso il rilevamento automatico degli errori.

2025-09-30T00:17:06+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Esaminare la Qualità della Voce e il Suo Impatto

Questo studio esplora i metodi di classificazione della qualità della voce e il loro significato nella comunicazione.

2025-09-29T12:28:25+00:00 ― 5 leggere min

Crittografia e sicurezza La crescente necessità di steganalisi nella sicurezza informatica

La steganalisi aiuta a scoprire messaggi nascosti nei multimedia, garantendo comunicazioni sicure.

2025-09-28T23:31:05+00:00 ― 4 leggere min

Multimedia TranSTYLer: Un Salto nella Comunicazione Virtuale

Trasformare i gesti per agenti virtuali mantenendo il significato.

2025-09-28T18:39:35+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Rilevare i Deepfake: Un Nuovo Approccio

Un metodo che usa audio e video per migliorare la rilevazione dei deepfake.

2025-09-27T19:29:12+00:00 ― 4 leggere min

Suono Avanzando la Generazione di Gestures per Umani Digitali

Un nuovo metodo crea gesti realistici a partire da audio vocale grezzo.

2025-09-27T08:39:05+00:00 ― 5 leggere min

Interazione uomo-macchina UnifiedGesture: Avanzando nella Generazione Automatica di Gesti

Un nuovo metodo per generare gesti che si abbinano efficacemente al parlato.

2025-09-27T06:35:00+00:00 ― 7 leggere min

Calcolo e linguaggio Affrontare la soggettività negli articoli di notizie

Riconoscere la soggettività nelle notizie è fondamentale per avere informazioni accurate.

2025-09-27T03:57:00+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli VEATIC: Un Nuovo Dataset per il Riconoscimento delle Emozioni

VEATIC offre un dataset più ricco per studiare le emozioni umane nel contesto.

2025-09-27T02:30:06+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Valutare la qualità nei modelli da testo a video

Valutare il realismo e la qualità dei video generati dal testo.

2025-09-26T21:14:06+00:00 ― 6 leggere min

Elaborazione di immagini e video Sviluppi nelle Tecniche di Compressione delle Immagini

Un nuovo metodo migliora la compressione delle immagini per vari tipi di immagini.

2025-09-25T16:58:30+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Affrontare il problema del bias nella lunghezza dei frame nel recupero video

Questo articolo parla del bias nella lunghezza dei frame nel recupero testo-video e di un nuovo approccio per affrontarlo.

2025-09-25T15:12:54+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Riconoscere il linguaggio del corpo nelle interazioni di gruppo

Un nuovo metodo migliora il modo in cui la tecnologia rileva il comportamento umano nei contesti di gruppo.

2025-09-24T16:34:06+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare l'affidabilità di CLIP con LP-CLIP

Scopri come LP-CLIP rinforza la robustezza dei modelli multimodali tipo CLIP.

2025-09-24T12:21:18+00:00 ― 5 leggere min

Calcolo e linguaggio Nuovo dataset rivoluziona la traduzione dei testi K-pop

Un dataset rivoluzionario aiuta lo studio della traduzione dei testi del K-pop.

2025-09-24T08:24:18+00:00 ― 8 leggere min

Apprendimento automatico Momenti audiovisivi nel tempo: un nuovo dataset per il riconoscimento delle azioni

AVMIT offre ai ricercatori spunti su come suono e visione si collegano nel riconoscimento delle azioni.

2025-09-24T07:46:35+00:00 ― 6 leggere min

Suono Progressi nella tecnologia anti-spoofing audio

Un nuovo metodo migliora il rilevamento di audio falso nei sistemi di riconoscimento vocale.

2025-09-23T23:40:45+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la Memoria del Video Tramite Ritagli Basati sulla Salienza

Questo studio esplora come il ritaglio possa migliorare il richiamo video concentrandosi sulla salienza visiva.

2025-09-23T18:03:12+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Valutare i modelli in compiti di visione a basso livello

Valutare modelli grandi su compiti visivi di basso livello tramite Q-Bench.

2025-09-22T06:53:54+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Combinare Suoni e Immagini per Migliorare la Qualità Audio

Un nuovo metodo migliora le registrazioni audio usando indizi visivi.

2025-09-22T03:57:15+00:00 ― 6 leggere min

Interazione uomo-macchina Il Ruolo dell'AI nel Racconto Digitale

Esplorare l'impatto dei contenuti generati dall'IA sull'arte del raccontare storie.

2025-09-22T02:56:54+00:00 ― 7 leggere min

Multimedia Collegare Emozioni nelle Immagini alla Ricerca Musicale

Un nuovo sistema collega immagini emotive alla musica per una scoperta migliore.

2025-09-21T16:37:05+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nella previsione del viewport per i video in streaming

MFTR migliora la precisione della previsione della viewport per esperienze video immersive.

2025-09-21T12:12:06+00:00 ― 6 leggere min

Interazione uomo-macchina Migliorare il controllo dei droni con la tecnologia dei gemelli digitali

Un sistema per rendere il controllo remoto degli UAV più sicuro e affidabile usando il Digital Twin.

2025-09-20T11:28:05+00:00 ― 6 leggere min

Ingegneria del software Affrontare il pregiudizio nei modelli di generazione di immagini

Un nuovo framework identifica e misura il bias nei sistemi di generazione di immagini.

2025-09-19T11:13:18+00:00 ― 9 leggere min

Visione artificiale e riconoscimento di modelli Miglioramenti nella Qualità delle Immagini con i Modelli di Diffusione

Esplora come i Modelli di Diffusione migliorano la super-risoluzione in vari campi.

2025-09-19T10:33:48+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli NU-Class Net: Migliorare la qualità video dopo la compressione

Un nuovo modello migliora i video a bassa qualità riducendo al contempo le richieste di elaborazione.

2025-09-19T05:25:42+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Un nuovo metodo per valutare la qualità di immagini e video

SAMA migliora la valutazione della qualità di immagini e video tramite tecniche di campionamento efficaci.

2025-09-19T00:33:24+00:00 ― 5 leggere min

Recupero delle informazioni Sfide nell'Imparare dai Video Musicali

Questo studio esamina le difficoltà nell'usare l'apprendimento contrastivo per comprendere i video musicali.

2025-09-18T17:21:45+00:00 ― 6 leggere min