Informatica - Multimedia

RSS

Visione artificiale e riconoscimento di modelli Il futuro del WebXR nel Metaverso

WebXR trasforma il modo in cui interagiamo con ambienti digitali immersivi.

2025-08-21T07:24:48+00:00 ― 9 leggere min

Multimedia Avanzamenti nella tecnologia da labiale a parlato

Nuovo metodo migliora la sintesi vocale per le persone che non possono parlare.

2025-08-20T20:14:25+00:00 ― 7 leggere min

Linguaggi di programmazione AniFrame: Semplificare il Coding Creativo per i Principianti

AniFrame rende l'arte della programmazione accessibile ai neofiti con un approccio facile da usare.

2025-08-19T18:40:42+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Fatti recenti nella sintesi di testo in immagini per le didascalie delle notizie

Nuovo set di dati migliora la generazione di immagini da didascalie di notizie complesse.

2025-08-19T17:13:48+00:00 ― 7 leggere min

Multimedia Verificare i Fatti sulla Disinformazione sui Social Media

Un nuovo metodo migliora il fact-checking delle affermazioni sui social media.

2025-08-19T05:30:42+00:00 ― 7 leggere min

Multimedia Presentiamo Shotit: Un nuovo modo per cercare video

Shotit permette agli utenti di trovare video rapidamente usando le immagini, semplificando il processo di ricerca.

2025-08-18T10:01:30+00:00 ― 6 leggere min

Recupero delle informazioni Migliorare le raccomandazioni in scenari di avvio a freddo

Un nuovo sistema per migliorare le raccomandazioni senza dati precedenti.

2025-08-17T21:15:12+00:00 ― 7 leggere min

Multimedia Pegasus-1: Un Nuovo Modello per la Comprensione Video

Pegasus-1 permette agli utenti di interagire con i video usando il linguaggio naturale.

2025-08-17T17:10:18+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Avanzamenti nella Sintesi di Teste Parlanti con GaussianTalker

GaussianTalker offre una sincronizzazione labiale naturale e una qualità visiva alta per i video con persone che parlano.

2025-08-17T09:24:12+00:00 ― 6 leggere min

Multimedia Metodo innovativo per il riconoscimento dei caratteri nei fumetti

Un nuovo approccio permette alle macchine di identificare i personaggi dei fumetti senza addestramento precedente.

2025-08-17T09:00:30+00:00 ― 6 leggere min

Interazione uomo-macchina Rendere l'audio spaziale accessibile per i creatori di video

Mimosa semplifica la creazione di audio spaziale per i video maker amatoriali.

2025-08-17T02:33:24+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Valutare la qualità dei video nei contenuti generati dagli utenti

La sfida AIS 2024 cerca di migliorare le valutazioni della qualità video usando il deep learning.

2025-08-16T21:01:36+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Umani Digitali Realistici: L'Ascesa di GaussianTalker

GaussianTalker trasforma l'interazione digitale con teste parlanti realistiche.

2025-08-16T19:34:42+00:00 ― 6 leggere min

Elaborazione dell'audio e del parlato Il Trend Crescente dei Sottotitoli nello Streaming

I sottotitoli stanno diventando fondamentali per migliorare l'esperienza degli spettatori nei servizi di streaming.

2025-08-16T05:18:30+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Nuovi metodi per rilevare i deepfake

La ricerca introduce tecniche innovative per migliorare il rilevamento dei video deepfake.

2025-08-14T19:39:06+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Presentiamo il dataset 360+x per una comprensione migliorata delle scene

Un nuovo set di dati migliora il modo in cui i robot interpretano gli ambienti reali.

2025-08-13T18:11:55+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Presentiamo UniAV: Un Approccio Unificato alla Localizzazione dei Video

UniAV combina localizzazione dell'azione, rilevamento del suono e localizzazione degli eventi audio-visivi per una migliore comprensione dei video.

2025-08-13T10:06:05+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Avanzamenti nelle tecniche di rilevamento degli oggetti

Un nuovo metodo migliora le prestazioni del rilevamento degli oggetti usando query adattive.

2025-08-13T07:50:18+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli La sfida di rilevare i deepfake

Esplorare la capacità umana di identificare video deepfake rispetto al rilevamento da parte dell'IA.

2025-08-12T22:05:42+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli L'impatto dell'IA sulla cinematografia

Esplorando come l'IA sta trasformando i processi di produzione video per i cineasti.

2025-08-12T15:38:36+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Ehi, ti presento PEAVS: un modo nuovo per misurare la sincronizzazione audio-visiva!

PEAVS analizza quanto bene audio e video funzionano insieme per migliorare l'esperienza degli spettatori.

2025-08-12T03:19:55+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Presentiamo CinePile: un nuovo standard nella comprensione dei video

CinePile sfida la comprensione di video lunghi con 305.000 domande diverse.

2025-08-11T01:11:48+00:00 ― 6 leggere min

Crittografia e sicurezza QMedShield: Proteggere le Immagini Mediche con la Crittografia Quantistica

Un nuovo metodo che protegge le immagini mediche nel cloud usando tecniche quantistiche avanzate.

2025-08-10T19:47:54+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Avanzare nella stima delle porzioni di cibo con modelli 3D

Un nuovo metodo migliora la precisione del tracciamento degli alimenti usando modelli 3D e immagini 2D.

2025-08-10T18:56:35+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli L'importanza del contesto nei compiti visivo-linguistici

Questo studio mostra come il contesto migliori la comprensione delle immagini e delle domande da parte delle macchine.

2025-08-10T10:50:42+00:00 ― 7 leggere min

Suono SemantiCodec: Il Prossimo Passo nella Tecnologia Audio

Un nuovo codec audio che offre una compressione di alta qualità e un contenuto semantico ricco.

2025-08-08T19:10:10+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare i video di facce parlanti realistici

Uno studio presenta un nuovo metodo per creare video di facce parlate sincronizzate.

2025-08-08T08:17:06+00:00 ― 5 leggere min

Intelligenza artificiale Il Futuro della Generazione Multimodale con LLMs

Esplora come i modelli di linguaggio di grandi dimensioni migliorano la creatività attraverso la generazione multimediale.

2025-08-04T21:12:12+00:00 ― 7 leggere min

Interazione uomo-macchina Il futuro del disegno 3D per i designer

Esplorare i vantaggi del disegno 3D immersivo per architetti e designer.

2025-08-04T19:45:18+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Un nuovo approccio alla generazione di contenuti audiovisivi

Presentiamo un modello che genera audio e video sincronizzati con livelli di rumore misti.

2025-08-04T14:45:50+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Un Modello Semplice per la Generazione Audio-Visiva

Questo articolo parla di un nuovo modello semplice per generare audio dalle immagini e viceversa.

2025-08-04T09:05:45+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nei Metodi di Creazione di Contenuti 3D

Nuove tecniche migliorano la qualità e l'addestramento per le immagini 3D.

2025-08-04T02:30:24+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli NuNet: Un nuovo modo per stimare la nutrizione

NuNet usa dati RGB e di profondità per avere stime nutrizionali migliori.

2025-08-03T08:51:48+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Approccio innovativo per la generazione congiunta di audio e video

Un nuovo metodo migliora l'allineamento audio-video usando modelli già addestrati.

2025-08-03T04:45:20+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Introducendo la Maschera di Attenzione Apprendibile per Compiti Multimodali

Un nuovo metodo per migliorare i meccanismi di attenzione nella lavorazione di dati complessi.

2025-08-02T16:00:36+00:00 ― 7 leggere min

Multimedia AI nello Streaming Video: Efficienza e Sostenibilità

Esplorare come l'IA migliora lo streaming video promuovendo l'efficienza energetica.

2025-08-02T11:08:18+00:00 ― 6 leggere min

Suono Avanzamenti nella generazione da video a audio con Frieren

Il modello Frieren migliora la qualità audio e la sincronizzazione per i video.

2025-08-02T10:07:55+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Avanzamenti nel Rendering di Scene Dinamiche con Gear-NeRF

Gear-NeRF migliora il rendering delle scene 3D dinamiche usando tecniche sensibili al movimento.

2025-08-02T05:52:18+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Tecniche di filigrana avanzate per la protezione delle immagini

Nuovi metodi rafforzano i watermark contro le minacce moderne di editing delle immagini.

2025-08-02T05:36:30+00:00 ― 8 leggere min

Interazione uomo-macchina Approcci Innovativi per Gestire i Rischi da Calore

Un nuovo sistema combina dati e notizie per una gestione migliore del rischio caldo.

2025-08-01T23:56:48+00:00 ― 6 leggere min