Informatica - Multimedia

RSS

Multimedia Progressi nelle tecniche di attacco ai watermark usando modelli di diffusione

Nuovi metodi migliorano la rimozione delle filigrane mantenendo la qualità dell'immagine.

2025-10-18T23:41:00+00:00 ― 6 leggere min

Calcolo e linguaggio Migliorare il rilevamento dei discorsi d'odio con mDT

Un nuovo metodo migliora il rilevamento dell'odio combinando testo, immagini e contesto della discussione.

2025-10-18T18:50:54+00:00 ― 7 leggere min

Architettura di rete e Internet Previsioni guidate dall'IA aumentano l'efficienza dei servizi XR

Le previsioni dell'IA migliorano il servizio per gli utenti di realtà estesa su reti avanzate.

2025-10-18T09:22:06+00:00 ― 5 leggere min

Multimedia Migliorare l'estrazione del parlante target con indizi visivi

Un nuovo modello migliora l'estrazione del parlato usando informazioni audio e visive.

2025-10-17T12:51:55+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Nuovo dataset mira a rilevare volti alterati

Il dataset RetouchingFFHQ migliora i metodi di rilevamento del ritocco facciale.

2025-10-17T11:46:30+00:00 ― 6 leggere min

Multimedia Rivoluzionare il monitoraggio del sonno dei neonati con LittleBeats

Lo studio usa un dispositivo multi-dati per monitorare i modelli di sonno dei neonati in modo più preciso.

2025-10-16T17:25:55+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare l'annotazione delle immagini con il metodo vTelos

Un nuovo modo per migliorare l'accuratezza delle etichette delle immagini nel machine learning.

2025-10-15T08:57:06+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Riconoscimento Efficiente delle Azioni nei Video con Meno Fotogrammi

Un nuovo metodo migliora il riconoscimento delle azioni usando meno fotogrammi senza perdere contesto importante.

2025-10-14T23:36:12+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la generazione di immagini da descrizioni testuali

Un nuovo metodo migliora come le immagini si abbinano ai testi.

2025-10-14T14:00:56+00:00 ― 6 leggere min

Basi di dati L'impatto della blockchain sulla gestione del copyright

Esplorare come la tecnologia blockchain possa ridefinire la gestione dei diritti d'autore per i creatori.

2025-10-14T07:24:30+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Metodo innovativo per smartphone per monitorare la malnutrizione

Un nuovo modo per valutare la salute usando solo un'immagine dello smartphone.

2025-10-13T21:47:48+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Semplificare l'etichettatura dei video con analisi visive

Un nuovo strumento semplifica il processo di etichettatura dei dati video in modo efficace.

2025-10-13T11:00:00+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Capire le emozioni nelle immagini con StyleEDL

Un nuovo metodo combina lo stile dell'immagine e il contenuto per interpretare le emozioni con precisione.

2025-10-12T03:24:00+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Avanzamenti nell'editing del testo in scena con FAST

FAST rivoluziona la modifica del testo nelle scene con modifiche naturali e flessibilità.

2025-10-12T01:17:36+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Avanzamenti nella generazione di forme 3D usando schizzi e testo

Un nuovo metodo combina schizzi e testo per migliorare la generazione di forme 3D.

2025-10-12T00:46:00+00:00 ― 8 leggere min

Multimedia Proteggere i diritti d'autore nei servizi di prompt

Un nuovo framework per proteggere i diritti dei creatori di prompt negli strumenti AI.

2025-10-11T23:42:48+00:00 ― 6 leggere min

Multimedia Sviluppi nei metodi di pre-addestramento Vision-Language

Un nuovo metodo migliora l'efficienza nei compiti di pre-addestramento Vision-Language.

2025-10-11T17:07:48+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la Creazione di Video con DiffSynth

DiffSynth migliora la qualità video riducendo il flickering e migliorando il blending dei fotogrammi.

2025-10-11T07:46:54+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Progressi nelle Reti Neurali Spiking: Compressione del Modello con Ottimizzazione Minimax

Uno sguardo a come l'ottimizzazione Minimax migliora l'efficienza delle reti neurali a picchi.

2025-10-11T03:18:18+00:00 ― 6 leggere min

Multimedia Jade: Un Nuovo Approccio alla Qualità dello Streaming Video

Jade migliora la qualità video grazie al feedback degli utenti e a tecniche di streaming adattivo.

2025-10-10T17:57:24+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Modello innovativo per la selezione dei colori nel design

Un nuovo modello consiglia colori basandosi su elementi di design e testo.

2025-10-10T17:49:30+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Trasferire i Movimenti delle Mani tra Avatar

Un nuovo metodo migliora la comunicazione gestuale per gli avatar con forme delle mani uniche.

2025-10-10T04:39:30+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Domande e Risposte Audio-Visive: Unire Suono e Vista

AVQA collega elementi audio e visivi nei video per rispondere alle domande.

2025-10-09T23:47:12+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Presentiamo il Face Animator Versatile per l'animazione 3D

Un nuovo metodo per creare animazioni facciali 3D realistiche in modo veloce ed efficiente.

2025-10-09T16:32:42+00:00 ― 6 leggere min

Crittografia e sicurezza Avanzamenti nella Steganografia Video e Rilevamento

Nuovi metodi migliorano la rilevazione di messaggi nascosti nei file video.

2025-10-09T09:34:00+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Trasformare teschi in immagini di animali vivi

Un metodo per tradurre immagini di teschi in rappresentazioni animali realistiche usando comandi testuali.

2025-10-08T21:43:00+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nell'Analisi Video in Tempo Reale

Nuovi metodi migliorano il rilevamento degli eventi nei video in streaming usando dati linguistici e storici.

2025-10-08T18:57:06+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Nuovo metodo per rilevare meme d'odio

Un nuovo approccio migliora la rilevazione di meme dannosi usando domande mirate.

2025-10-08T12:22:06+00:00 ― 8 leggere min

Multimedia EMID: Un Nuovo Approccio a Musica e Immagini

Esplora i legami emotivi tra musica e immagini con il dataset EMID.

2025-10-08T07:45:36+00:00 ― 6 leggere min

Elaborazione di immagini e video Ricostruire immagini visive dai segnali cerebrali

Questa ricerca collega l'attività cerebrale alla percezione visiva ricostruendo immagini dai segnali EEG.

2025-10-08T06:54:00+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Collegare parole a immagini: il grounding visivo svelato

Scopri l'impatto del grounding visivo nelle interazioni tra linguaggio e immagini.

2025-10-07T08:43:06+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Avanzando il riconoscimento video con AVGN

Un nuovo metodo migliora l'efficienza nel riconoscimento video usando dati audio e visivi.

2025-10-07T00:09:36+00:00 ― 5 leggere min

Intelligenza artificiale Sviluppi nell'IA per il test dei giochi

Un nuovo agente IA migliora l'efficienza e la qualità del testing dei giochi.

2025-10-06T23:38:00+00:00 ― 7 leggere min

Multimedia Presentiamo Dronevision: un sistema di display 3D compatto

Dronevision rivoluziona il multimedia 3D con un display delle dimensioni di una scrivania usando droni volanti.

2025-10-06T22:03:12+00:00 ― 7 leggere min

Multimedia Valutare i sensori di distanza per puntini luminosi volanti

Uno studio sui sensori vitali per le prestazioni dei nuovi droni.

2025-10-06T21:55:18+00:00 ― 4 leggere min

Recupero delle informazioni Avanzando i sistemi di raccomandazione con dati multi-modali

Un nuovo framework migliora i suggerimenti di articoli usando diversi tipi di dati.

2025-10-05T12:52:24+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli EVE: Un Nuovo Approccio ai Modelli Visione-Linguaggio

Scopri EVE, un modello che migliora la comprensione di immagini e testo.

2025-10-05T11:09:42+00:00 ― 6 leggere min

Multimedia Avanzamenti nei modelli di pre-addestramento visione-linguaggio

La ricerca si concentra sul miglioramento dei modelli che collegano le immagini e il testo attraverso la comprensione del linguaggio.

2025-10-04T21:51:48+00:00 ― 7 leggere min

Interazione uomo-macchina Avanzamenti nella generazione di gesti per la comunicazione AI

Il nuovo modello migliora la generazione dei gesti per interazioni più simili a quelle umane.

2025-10-04T05:32:12+00:00 ― 5 leggere min

Multimedia Progressi nel Matching Acustico Visivo

Un nuovo metodo migliora l'abbinamento audio usando immagini, rendendo più realistici gli ambienti sonori.

2025-10-03T03:55:25+00:00 ― 7 leggere min