Informatica - Multimedia

RSS

Interazione uomo-macchina UnifiedGesture: Avanzando nella Generazione Automatica di Gesti

Un nuovo metodo per generare gesti che si abbinano efficacemente al parlato.

2025-09-27T06:35:00+00:00 ― 7 leggere min

Calcolo e linguaggio Affrontare la soggettività negli articoli di notizie

Riconoscere la soggettività nelle notizie è fondamentale per avere informazioni accurate.

2025-09-27T03:57:00+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli VEATIC: Un Nuovo Dataset per il Riconoscimento delle Emozioni

VEATIC offre un dataset più ricco per studiare le emozioni umane nel contesto.

2025-09-27T02:30:06+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Valutare la qualità nei modelli da testo a video

Valutare il realismo e la qualità dei video generati dal testo.

2025-09-26T21:14:06+00:00 ― 6 leggere min

Elaborazione di immagini e video Sviluppi nelle Tecniche di Compressione delle Immagini

Un nuovo metodo migliora la compressione delle immagini per vari tipi di immagini.

2025-09-25T16:58:30+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Affrontare il problema del bias nella lunghezza dei frame nel recupero video

Questo articolo parla del bias nella lunghezza dei frame nel recupero testo-video e di un nuovo approccio per affrontarlo.

2025-09-25T15:12:54+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Riconoscere il linguaggio del corpo nelle interazioni di gruppo

Un nuovo metodo migliora il modo in cui la tecnologia rileva il comportamento umano nei contesti di gruppo.

2025-09-24T16:34:06+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare l'affidabilità di CLIP con LP-CLIP

Scopri come LP-CLIP rinforza la robustezza dei modelli multimodali tipo CLIP.

2025-09-24T12:21:18+00:00 ― 5 leggere min

Calcolo e linguaggio Nuovo dataset rivoluziona la traduzione dei testi K-pop

Un dataset rivoluzionario aiuta lo studio della traduzione dei testi del K-pop.

2025-09-24T08:24:18+00:00 ― 8 leggere min

Apprendimento automatico Momenti audiovisivi nel tempo: un nuovo dataset per il riconoscimento delle azioni

AVMIT offre ai ricercatori spunti su come suono e visione si collegano nel riconoscimento delle azioni.

2025-09-24T07:46:35+00:00 ― 6 leggere min

Suono Progressi nella tecnologia anti-spoofing audio

Un nuovo metodo migliora il rilevamento di audio falso nei sistemi di riconoscimento vocale.

2025-09-23T23:40:45+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la Memoria del Video Tramite Ritagli Basati sulla Salienza

Questo studio esplora come il ritaglio possa migliorare il richiamo video concentrandosi sulla salienza visiva.

2025-09-23T18:03:12+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Valutare i modelli in compiti di visione a basso livello

Valutare modelli grandi su compiti visivi di basso livello tramite Q-Bench.

2025-09-22T06:53:54+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Combinare Suoni e Immagini per Migliorare la Qualità Audio

Un nuovo metodo migliora le registrazioni audio usando indizi visivi.

2025-09-22T03:57:15+00:00 ― 6 leggere min

Interazione uomo-macchina Il Ruolo dell'AI nel Racconto Digitale

Esplorare l'impatto dei contenuti generati dall'IA sull'arte del raccontare storie.

2025-09-22T02:56:54+00:00 ― 7 leggere min

Multimedia Collegare Emozioni nelle Immagini alla Ricerca Musicale

Un nuovo sistema collega immagini emotive alla musica per una scoperta migliore.

2025-09-21T16:37:05+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nella previsione del viewport per i video in streaming

MFTR migliora la precisione della previsione della viewport per esperienze video immersive.

2025-09-21T12:12:06+00:00 ― 6 leggere min

Interazione uomo-macchina Migliorare il controllo dei droni con la tecnologia dei gemelli digitali

Un sistema per rendere il controllo remoto degli UAV più sicuro e affidabile usando il Digital Twin.

2025-09-20T11:28:05+00:00 ― 6 leggere min

Ingegneria del software Affrontare il pregiudizio nei modelli di generazione di immagini

Un nuovo framework identifica e misura il bias nei sistemi di generazione di immagini.

2025-09-19T11:13:18+00:00 ― 9 leggere min

Visione artificiale e riconoscimento di modelli Miglioramenti nella Qualità delle Immagini con i Modelli di Diffusione

Esplora come i Modelli di Diffusione migliorano la super-risoluzione in vari campi.

2025-09-19T10:33:48+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli NU-Class Net: Migliorare la qualità video dopo la compressione

Un nuovo modello migliora i video a bassa qualità riducendo al contempo le richieste di elaborazione.

2025-09-19T05:25:42+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Un nuovo metodo per valutare la qualità di immagini e video

SAMA migliora la valutazione della qualità di immagini e video tramite tecniche di campionamento efficaci.

2025-09-19T00:33:24+00:00 ― 5 leggere min

Recupero delle informazioni Sfide nell'Imparare dai Video Musicali

Questo studio esamina le difficoltà nell'usare l'apprendimento contrastivo per comprendere i video musicali.

2025-09-18T17:21:45+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Rivoluzionare gli occhi dei personaggi nell'animazione

Un nuovo metodo semplifica il design degli occhi dei personaggi animati.

2025-09-18T14:01:24+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Avanzando la compressione delle immagini con l'analisi della frequenza

Un nuovo metodo migliora la compressione delle immagini concentrandosi sulle bande di frequenza.

2025-09-16T14:45:18+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Vlogger: Un Nuovo Strumento per Creare Video

Vlogger semplifica il video blogging, rendendo tutto più veloce e facile per i creatori.

2025-09-16T11:12:00+00:00 ― 6 leggere min

Multimedia I costi ambientali dello streaming video

Esaminando l'uso dell'energia e l'impatto dello streaming video sull'ambiente.

2025-09-16T01:59:00+00:00 ― 6 leggere min

Suono Nuovo modello migliora la valutazione dell'intensità di alimentazione dei pesci

Un approccio unificato per valutare l'alimentazione dei pesci usando dati audio e video.

2025-09-14T21:03:15+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli L'impatto dell'IA sulla tecnologia video

Scopri come l'IA sta cambiando la creazione e lo streaming di video.

2025-09-13T11:18:36+00:00 ― 6 leggere min

Elaborazione di immagini e video Presentiamo il Dataset di Videoconferenza per la Comunicazione nel Mondo Reale

Un dataset fatto apposta per testare la qualità video in situazioni di videoconferenza.

2025-09-13T03:45:30+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Nuovo framework collega video e testo in modo più efficace

I ricercatori hanno sviluppato un framework per capire meglio video e testo.

2025-09-12T20:49:36+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nelle Tecniche di Segmentazione Audio-Visiva

Un nuovo metodo migliora la segmentazione audio-visiva senza etichette dettagliate.

2025-09-12T20:28:15+00:00 ― 6 leggere min

Suono Nuovo sistema migliora l'estrazione della voce da posizioni della testa instabili

PIAVE aiuta le macchine a estrarre le voci in modo chiaro, anche quando i parlanti girano la testa.

2025-09-12T19:39:40+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato MusiLingo: Unire Musica e Lingua

Un nuovo sistema che collega musica e lingua per una comprensione migliore.

2025-09-11T14:30:40+00:00 ― 6 leggere min

Multimedia Progettazione di poster efficace tramite metriche semplici

Impara a progettare manifesti che comunicano messaggi in modo chiaro e attraente.

2025-09-09T08:49:24+00:00 ― 5 leggere min

Multimedia BDIQA: Avanzare nella risposta a domande sui video con la teoria della mente

Un nuovo dataset migliora la capacità dell'AI di interpretare il comportamento umano nei video.

2025-09-09T07:30:24+00:00 ― 7 leggere min

Interazione uomo-macchina Spica: Un Nuovo Strumento per Utenti Ciechi

Spica migliora l'accesso ai video per utenti non vedenti e ipovedenti tramite l'interattività.

2025-09-09T06:43:00+00:00 ― 5 leggere min

Robotica Testare i robot per sfide inaspettate

Esplorando metodi per migliorare le performance dei robot in ambienti imprevedibili.

2025-09-09T02:53:54+00:00 ― 5 leggere min

Suono Progressi nella tecnologia di conversione vocale usando immagini facciali

Un nuovo metodo trasforma le voci usando le caratteristiche facciali per diverse applicazioni.

2025-09-09T01:46:55+00:00 ― 9 leggere min

Elaborazione dell'audio e del parlato Presentiamo AV-SUPERB: un nuovo punto di riferimento per i modelli audio-visivi

AV-SUPERB valuta modelli audio e visivi su vari task per migliorare le prestazioni.

2025-09-08T22:32:35+00:00 ― 6 leggere min