Informatica - Multimedia

RSS

Multimedia Valutare la qualità dei corsi online con VCEval

VCEval offre un modo automatico per valutare l'efficacia dei corsi online.

2025-07-28T10:39:48+00:00 ― 5 leggere min

Multimedia Nuovo modello migliora il rilevamento degli highlight in live streaming

Un approccio multimodale migliora il modo in cui si identificano i momenti salienti nei live stream.

2025-07-28T10:24:00+00:00 ― 6 leggere min

Suono Un nuovo strumento per la visualizzazione musicale

Questo documento presenta un sistema per creare immagini che rispondono alla musica.

2025-07-26T10:31:10+00:00 ― 7 leggere min

Recupero delle informazioni Avanzamento delle tecniche di recupero cross-lingue e cross-modali

Un nuovo metodo migliora il recupero di immagini e testi in più lingue.

2025-07-23T21:54:24+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Il Ruolo dei Modelli di Diffusione nel Montaggio Video

Scopri come i modelli di diffusione stanno rivoluzionando il video editing grazie alla tecnologia AI.

2025-07-23T18:13:12+00:00 ― 5 leggere min

Multimedia Analizzare la popolarità sui social media: disallineamento tra testo e immagine

La ricerca mostra che l'incoerenza tra testo e immagine aumenta con la popolarità dei post sui social.

2025-07-22T14:26:18+00:00 ― 5 leggere min

Suono Avanzare nella generazione audio con il dataset Sound-VECaps

Nuovo dataset migliora la generazione audio da descrizioni testuali dettagliate.

2025-07-21T07:26:30+00:00 ― 5 leggere min

Multimedia OpenVNA: Potenziare la Comprensione Linguistica nel Rumore

Un nuovo strumento per testare i modelli linguistici in ambienti rumorosi.

2025-07-21T05:23:24+00:00 ― 4 leggere min

Multimedia Migliorare l'estrazione della mesh di riferimento da forme variabili nel tempo

Un nuovo metodo per creare mesh di riferimento più pulite da forme 3D dinamiche.

2025-07-20T22:24:42+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nella segmentazione delle espressioni di riferimento debolmente supervisionate

Un nuovo metodo riduce la necessità di dati etichettati nei compiti di visione artificiale.

2025-07-20T20:57:48+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Nuovo metodo per creare suono da video e testo

Questo articolo presenta un metodo per generare suoni precisi da video e testo.

2025-07-20T16:03:25+00:00 ― 7 leggere min

Calcolo e linguaggio Avanzamenti nella gestione dei documenti con LayTextLLM

Presentiamo un nuovo modello che combina in modo efficiente testo e layout per una migliore comprensione dei documenti.

2025-07-20T12:48:00+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli KeyVideoLLM: Migliorare la gestione dei dati video

Un nuovo metodo migliora la gestione dei dati video per una comprensione e un'efficienza migliori.

2025-07-20T06:52:30+00:00 ― 5 leggere min

Interazione uomo-macchina Avanzando l'IA mobile con il dataset AMEX

Il dataset AMEX migliora la comprensione dell'IA sulle interfacce delle app mobili.

2025-07-20T00:09:36+00:00 ― 7 leggere min

Suono Nuovi dataset per il riconoscimento delle emozioni nella musica

Presentiamo i dataset MERGE per migliorare la classificazione delle emozioni nella musica.

2025-07-19T20:37:25+00:00 ― 6 leggere min

Multimedia I videogiochi come strumenti per imparare le abilità di programmazione

Esplorare come i videogiochi possano insegnare abilità di programmazione essenziali in modo efficace e coinvolgente.

2025-07-19T06:31:00+00:00 ― 5 leggere min

Multimedia Progressi nell'Apprendimento Audio-Visivo Zero-Shot

Unire suoni e immagini per sistemi di riconoscimento più intelligenti.

2025-07-18T21:08:30+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Semplificare la creazione di video con il framework VCoME

VCoME aiuta gli utenti a creare video verbali coinvolgenti facilmente.

2025-07-18T18:32:06+00:00 ― 5 leggere min

Suono Avanzamenti nella tecnologia di generazione video-audio

I ricercatori vogliono creare suoni che si abbinino a video silenziosi, migliorando l'esperienza degli spettatori.

2025-07-18T12:14:05+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la Generazione di Domande Visive con Doppie Indizi

Un nuovo approccio migliora la chiarezza delle domande generate dalle immagini.

2025-07-18T06:17:24+00:00 ― 7 leggere min

Crittografia e sicurezza Incorporare le firme digitali nei file CSV

Scopri come proteggere i dati CSV con firme digitali.

2025-07-18T03:15:42+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Miglioramenti nelle tecniche di recupero di immagini composte

Questo metodo migliora la ricerca di immagini combinando in modo efficace immagini e testo.

2025-07-17T08:26:00+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Presentiamo LeRF: Un modo nuovo per ridimensionare le immagini

LeRF combina deep learning e interpolazione per un resizing delle immagini migliore.

2025-07-16T22:59:15+00:00 ― 7 leggere min

Elaborazione di immagini e video L'IA aiuta i radiologi ad analizzare le radiografie del torace

Nuovo modello di intelligenza artificiale migliora l'interpretazione delle radiografie del torace per diagnosi migliori.

2025-07-16T07:36:10+00:00 ― 7 leggere min

Calcolo e linguaggio Avanzare nella creazione di contenuti sui social media con l'IA

Un nuovo metodo per creare contenuti coinvolgenti sui social media usando l'AI.

2025-07-15T21:48:18+00:00 ― 7 leggere min

Suono BandControlNet: Un Nuovo Approccio alla Creazione Musicale

Scopri come l'IA sta trasformando la generazione musicale con BandControlNet.

2025-07-15T19:27:25+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Nuovo metodo per rilevare i deepfake

Un nuovo approccio migliora il rilevamento dei deepfake usando analisi audio-visiva.

2025-07-15T12:10:10+00:00 ― 6 leggere min

Suono Migliorare il riconoscimento della balbuzie con MMSD-Net

Un nuovo metodo migliora il rilevamento della balbuzie combinando dati audio, video e testo.

2025-07-15T07:18:40+00:00 ― 6 leggere min

Multimedia Avanzare nella localizzazione delle fonti sonore attraverso l'integrazione audio-visiva

Uno studio su come migliorare la localizzazione delle sorgenti sonore sfruttando meglio le informazioni audio e visive.

2025-07-14T06:12:35+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Avanzamenti nella visualizzazione delle storie con TemporalStory

TemporalStory migliora la generazione di immagini per il racconto di storie rendendo tutto più coerente e contestualizzato.

2025-07-13T23:59:06+00:00 ― 5 leggere min

Suono Valutare l'impatto dell'IA sull'originalità della musica

Un nuovo strumento per valutare la replicazione nella musica creata dall'IA.

2025-07-13T12:23:45+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la chiarezza delle immagini tramite tecniche di dehazing

Uno sguardo ai metodi per migliorare la qualità delle immagini colpite dalla foschia.

2025-07-12T23:26:25+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Nuovo dataset affronta le sfide della contraffazione delle immagini

Il dataset TGIF aiuta a rilevare tecniche avanzate di manipolazione delle immagini.

2025-07-12T07:49:36+00:00 ― 5 leggere min

Elaborazione dell'audio e del parlato Trasformare la diffusione con tecnologia IP e tagging audio

Scopri come la trasmissione IP e il tagging audio stanno ridefinendo la distribuzione dei contenuti.

2025-07-12T05:37:35+00:00 ― 5 leggere min

Computer e società Ottimizzare il marketing online con le intuizioni dell'IA

Integrare l'IA per migliorare le strategie di marketing e l'efficacia delle campagne.

2025-07-12T01:38:18+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la comprensione visiva nei modelli linguistici

X-Former migliora come i modelli combinano la comprensione di immagini e testo.

2025-07-11T06:40:42+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Affrontare la disinformazione fuori contesto nell'era digitale

Contrastare le informazioni fuorvianti con nuovi metodi e tecnologie.

2025-07-10T22:46:42+00:00 ― 5 leggere min

Calcolo e linguaggio Tecniche avanzate per la rilevazione della disinformazione

Un nuovo sistema che combina analisi del testo e delle immagini per combattere la disinformazione.

2025-07-10T07:30:18+00:00 ― 5 leggere min

Multimedia Migliorare l'efficienza nei modelli multi-modali con RoE

Il nuovo metodo RoE migliora l'efficienza dei modelli di linguaggio multi-modali con un routing dinamico.

2025-07-10T02:38:00+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nella generazione di fotogrammi video a 360 gradi

Presentiamo 360VFI per una qualità e un'esperienza video a 360 gradi migliorate.

2025-07-10T01:42:42+00:00 ― 6 leggere min