Un nuovo metodo migliora il riconoscimento delle azioni usando meno fotogrammi senza perdere contesto importante.
― 8 leggere min
Scienza all'avanguardia spiegata semplicemente
Un nuovo metodo migliora il riconoscimento delle azioni usando meno fotogrammi senza perdere contesto importante.
― 8 leggere min
Articoli più recenti
Articoli più recenti
FAST rivoluziona la modifica del testo nelle scene con modifiche naturali e flessibilità.
― 6 leggere min
Un nuovo metodo combina schizzi e testo per migliorare la generazione di forme 3D.
― 8 leggere min
Un nuovo framework per proteggere i diritti dei creatori di prompt negli strumenti AI.
― 6 leggere min
Un nuovo metodo migliora l'efficienza nei compiti di pre-addestramento Vision-Language.
― 6 leggere min
DiffSynth migliora la qualità video riducendo il flickering e migliorando il blending dei fotogrammi.
― 6 leggere min
Uno sguardo a come l'ottimizzazione Minimax migliora l'efficienza delle reti neurali a picchi.
― 6 leggere min
Jade migliora la qualità video grazie al feedback degli utenti e a tecniche di streaming adattivo.
― 5 leggere min
Un nuovo modello consiglia colori basandosi su elementi di design e testo.
― 5 leggere min
Un nuovo metodo migliora la comunicazione gestuale per gli avatar con forme delle mani uniche.
― 5 leggere min
AVQA collega elementi audio e visivi nei video per rispondere alle domande.
― 6 leggere min
Un nuovo metodo per creare animazioni facciali 3D realistiche in modo veloce ed efficiente.
― 6 leggere min
Nuovi metodi migliorano la rilevazione di messaggi nascosti nei file video.
― 6 leggere min
Un metodo per tradurre immagini di teschi in rappresentazioni animali realistiche usando comandi testuali.
― 5 leggere min
Nuovi metodi migliorano il rilevamento degli eventi nei video in streaming usando dati linguistici e storici.
― 6 leggere min
Un nuovo approccio migliora la rilevazione di meme dannosi usando domande mirate.
― 8 leggere min
Esplora i legami emotivi tra musica e immagini con il dataset EMID.
― 6 leggere min
Questa ricerca collega l'attività cerebrale alla percezione visiva ricostruendo immagini dai segnali EEG.
― 7 leggere min
Scopri l'impatto del grounding visivo nelle interazioni tra linguaggio e immagini.
― 7 leggere min
Un nuovo metodo migliora l'efficienza nel riconoscimento video usando dati audio e visivi.
― 5 leggere min
Un nuovo agente IA migliora l'efficienza e la qualità del testing dei giochi.
― 7 leggere min
Dronevision rivoluziona il multimedia 3D con un display delle dimensioni di una scrivania usando droni volanti.
― 7 leggere min
Uno studio sui sensori vitali per le prestazioni dei nuovi droni.
― 4 leggere min
Un nuovo framework migliora i suggerimenti di articoli usando diversi tipi di dati.
― 5 leggere min
Scopri EVE, un modello che migliora la comprensione di immagini e testo.
― 6 leggere min
La ricerca si concentra sul miglioramento dei modelli che collegano le immagini e il testo attraverso la comprensione del linguaggio.
― 7 leggere min
Il nuovo modello migliora la generazione dei gesti per interazioni più simili a quelle umane.
― 5 leggere min
Un nuovo metodo migliora l'abbinamento audio usando immagini, rendendo più realistici gli ambienti sonori.
― 7 leggere min
Esaminando le preoccupazioni sui dati nascosti nei modelli di machine learning e le loro implicazioni per la sicurezza.
― 7 leggere min
Un dataset collega le emozioni alle canzoni MIDI tramite l'analisi del testo delle canzoni.
― 7 leggere min
Un nuovo approccio migliora l'accuratezza nel rispondere a domande su testi nelle immagini.
― 5 leggere min
PROOFREAD migliora il riconoscimento delle domande visive usando le conoscenze dei grandi modelli linguistici.
― 6 leggere min
Usando LLM per creare un enorme dataset per la captioning musicale.
― 7 leggere min
La Terrain Diffusion Network migliora la creazione di paesaggi realistici con il coinvolgimento degli utenti.
― 5 leggere min
HierVST trasforma le voci senza sforzo, migliorando la qualità audio senza bisogno di dati estesi.
― 5 leggere min
Un nuovo approccio trasforma le foto del viso in disegni simili a esseri umani usando tecniche avanzate.
― 6 leggere min
La ricerca sviluppa un modello per misurare con precisione l'engagement nelle conversazioni.
― 6 leggere min
Un nuovo modo per proteggere le immagini RAW da manipolazioni.
― 5 leggere min
Nuovo set di dati e metodi migliorano l'accuratezza nel rispondere a domande sui video.
― 7 leggere min
Il framework UniSA unifica i compiti nell'analisi del sentiment per un riconoscimento delle emozioni migliore.
― 5 leggere min
Un metodo che usa le girate della testa inganna con successo i sistemi di rilevamento dei deepfake.
― 5 leggere min