Informatica - Multimedia

RSS

Interazione uomo-macchina Affrontare le Hate Raids nelle comunità di Live Streaming

Uno sguardo sui raid d'odio e il loro impatto sui creatori di contenuti emarginati.

2025-11-09T22:07:24+00:00 ― 5 leggere min

Articoli più recenti

Visione artificiale e riconoscimento di modelli Avanzare la compressione delle immagini per la percezione umana

2025-11-09T19:34:25+00:00 ― 6 leggere min

Calcolo e linguaggio Capire i meme attraverso l'analisi contestuale

2025-11-09T18:10:24+00:00 ― 6 leggere min

Suono Approcci Innovativi alla Riorganizzazione della Musica

2025-11-09T15:31:30+00:00 ― 6 leggere min

Recupero delle informazioni Presentiamo il SURE Dataset per i Dialoghi di Shopping

2025-11-09T10:24:18+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Un Nuovo Approccio alla Risposta Visiva alle Domande

2025-11-08T19:07:54+00:00 ― 5 leggere min

Articoli più recenti

Calcolo e linguaggio Rivedere i passaggi del compito usando l'analisi video

Un nuovo metodo per organizzare meglio i passaggi dei compiti con video utili.

2025-11-08T18:04:42+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Avanzamenti nella misurazione della qualità di deblurring

Migliorare le metriche per valutare i metodi di deblurring usando un nuovo dataset.

2025-11-08T16:14:06+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare i modelli Vision-Language con il feedback di CLIP

Un nuovo metodo migliora i modelli vision-language con feedback in tempo reale per prestazioni migliori.

2025-11-08T04:38:54+00:00 ― 6 leggere min

Calcolo e linguaggio Modelli Avanzati per il Riconoscimento delle Fake News

Nuovi modelli migliorano il rilevamento delle fake news usando tecniche di dati diverse.

2025-11-08T01:13:30+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Progressi nei sistemi multi-camera per veicoli autonomi

Occ-BEV migliora la percezione del veicolo tramite modellazione 3D con più telecamere e integrazione dei dati.

2025-11-07T14:57:18+00:00 ― 6 leggere min

Crittografia e sicurezza Analizzando il Metodo J-UNIWARD e i Suoi Errori

Uno sguardo alla tecnica di nascondere messaggi di J-UNIWARD e al suo piccolo errore di calcolo.

2025-11-06T17:05:54+00:00 ― 4 leggere min

Visione artificiale e riconoscimento di modelli Affrontare il bias nella risposta visiva a domande

Un nuovo approccio affronta i pregiudizi linguistici e visivi nei sistemi VQA.

2025-11-06T14:27:54+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la qualità della compressione delle nuvole di punti 3D

Un metodo per migliorare i dati di nuvole di punti 3D compressi usando reti neurali avanzate.

2025-11-06T06:33:54+00:00 ― 6 leggere min

Apprendimento automatico Avanzando l'apprendimento multi-modale con C-MCR

C-MCR semplifica l'apprendimento multi-modale collegando in modo efficiente le conoscenze esistenti.

2025-11-05T03:49:55+00:00 ― 6 leggere min

Suono Semplificare la Sintesi Sonora con NAS-FM

Un nuovo metodo per creare sintetizzatori che avvantaggia i musicisti.

2025-11-04T17:18:20+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Do-GOOD Benchmark: Migliorare i modelli di comprensione dei documenti

Nuovo benchmark svela lacune nelle prestazioni dei modelli di elaborazione dei documenti.

2025-11-04T02:17:36+00:00 ― 8 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nella Segmentazione Semantica Panoramica

Nuovo modello migliora l'analisi delle immagini panoramiche per applicazioni nel mondo reale.

2025-11-04T00:19:06+00:00 ― 5 leggere min

Interazione uomo-macchina LoopBoxes: Un Nuovo Modo di Fare Musica

LoopBoxes aiuta i bambini a creare musica in modo semplice e collaborativo.

2025-11-03T08:55:00+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Sfide nel recupero testo-video e soluzioni

Uno sguardo ai pregiudizi nel recupero di testo-video e modi per migliorare l'accuratezza.

2025-11-03T00:45:00+00:00 ― 6 leggere min

Suono Progressi nelle Tecniche di Classificazione Audio

Un nuovo metodo migliora la classificazione audio imparando nuovi suoni in modo efficiente.

2025-10-31T22:37:00+00:00 ― 4 leggere min

Multimedia 360TripleView: Migliorare l'Esperienza Video a 360 Gradi

Un nuovo sistema migliora la selezione della direzione di visualizzazione nei video a 360 gradi.

2025-10-31T20:44:30+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli GeneCIS: Migliorare la Somiglianza Condizionale delle Immagini nella Visione Artificiale

Un benchmark per valutare la somiglianza delle immagini in base a condizioni definite dall'utente.

2025-10-31T19:09:42+00:00 ― 6 leggere min

Suono Avanzando la risposta alle domande audio con il modello MWAFM

Un nuovo modello migliora come le macchine capiscono e rispondono a domande audio.

2025-10-31T18:34:05+00:00 ― 6 leggere min

Multimedia Bilanciare l'apprendimento attivo nei dati multimodali

Una nuova strategia assicura una rappresentanza equa dei tipi di dati nel machine learning.

2025-10-31T02:02:42+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Sviluppi nelle tecniche di rilevamento dei video

Un nuovo set di dati mette alla prova i metodi per rilevare contenuti video alterati.

2025-10-30T18:16:36+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Avanzando nel telerilevamento con RS5M e DVLM

Un nuovo set di dati e modello migliorano l'analisi delle immagini di telerilevamento.

2025-10-29T03:49:48+00:00 ― 6 leggere min

Multimedia Ottimizzare lo stoccaggio video per le operazioni di cataratta

La ricerca mostra modi efficaci per comprimere i video di chirurgia della cataratta per una migliore gestione dello spazio.

2025-10-28T02:25:06+00:00 ― 5 leggere min

Suono Analizzare la musica con BERT: un nuovo approccio

La ricerca esplora il potenziale di BERT nell'analisi musicale a livello di bar.

2025-10-27T07:41:05+00:00 ― 5 leggere min

Suono Avanzare nella armonizzazione delle melodie con un contesto emotivo

Un nuovo modello migliora l'armonizzazione delle melodie considerando fattori emotivi.

2025-10-26T21:58:05+00:00 ― 6 leggere min

Multimedia Sviluppi nella tecnologia di compressione video

Un nuovo metodo migliora la compressione video mantenendo qualità ed efficienza.

2025-10-26T05:46:25+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la segmentazione delle istanze alimentari con etichettatura intelligente

Un nuovo framework riduce i costi di etichettatura manuale nella segmentazione delle immagini alimentari.

2025-10-25T23:35:42+00:00 ― 6 leggere min

Recupero delle informazioni Un nuovo framework per raccomandazioni multimodali

Questo framework semplifica l'elaborazione dei dati per avere migliori sistemi di raccomandazione.

2025-10-25T18:59:12+00:00 ― 6 leggere min

Multimedia Migliorare l'efficienza della codifica video con nuove tecniche

Un nuovo metodo accelera la codifica video mantenendo la qualità.

2025-10-25T14:30:36+00:00 ― 5 leggere min

Suono Creare melodie da ritmi semplici

Questo progetto aiuta chiunque a comporre musica usando ritmi base e metodi informatici avanzati.

2025-10-25T11:57:35+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Progressi nei modelli linguistici e visivi

Il nuovo modello collega la comprensione del linguaggio con l'elaborazione delle immagini in modo efficace.

2025-10-25T06:20:48+00:00 ― 6 leggere min

Multimedia Un Nuovo Sistema per Abbinare Musica e Video

Questa ricerca presenta un sistema per abbinare la musica ai contenuti video in modo efficace.

2025-10-24T07:37:10+00:00 ― 7 leggere min

Multimedia Il Metaverso: Un Nuovo Paesaggio Digitale

Scopri il Metaverso in evoluzione e il suo impatto sulla comunicazione e sull'economia.

2025-10-24T03:21:18+00:00 ― 6 leggere min

Computer e società Il Ruolo dei Trascritti nei Video Educativi

Le trascrizioni migliorano la comprensione dei video educativi, risolvendo problemi di qualità audio.

2025-10-24T02:33:54+00:00 ― 6 leggere min

Elaborazione del segnale Avanzamenti nella trasmissione di nuvole di punti 3D con SEPT

SEPT migliora la trasmissione wireless di nuvole di punti 3D usando il deep learning.

2025-10-23T03:16:45+00:00 ― 5 leggere min

Recupero delle informazioni Un nuovo set di dati multilingue per le notizie video

Questo dataset punta a migliorare il recupero di notizie video in cinque lingue.

2025-10-23T01:32:54+00:00 ― 6 leggere min

Visione artificiale e riconoscimento di modelli Migliorare la selezione dei frame per il video question answering

Nuovi metodi migliorano il modo in cui i modelli selezionano i frame per rispondere a domande dai video.

2025-10-22T05:40:00+00:00 ― 7 leggere min

Visione artificiale e riconoscimento di modelli Migliorare le videochiamate con la codifica predittiva

Un nuovo metodo migliora la qualità delle videochiamate risparmiando banda.

2025-10-22T03:02:00+00:00 ― 5 leggere min

Visione artificiale e riconoscimento di modelli Trasformare le foto in disegni a linea di personaggi

Un metodo per creare disegni artistici a linee a partire da foto, con il controllo dell'utente.

2025-10-19T23:25:12+00:00 ― 6 leggere min

Multimedia Avanzare i compiti video-testo in lingua indonesiana

Nuovo dataset migliora i compiti video-testo per i parlanti indonesiani.

2025-10-19T21:32:45+00:00 ― 7 leggere min

Suono Progressi nella Misurazione della Somiglianza Musicale

La ricerca punta a combinare dati audio e simbolici per analizzare la somiglianza musicale.

2025-10-19T11:49:45+00:00 ― 7 leggere min