Nuovo metodo migliora l'accuratezza nella misurazione della frequenza cardiaca nei video compressi.
― 6 leggere min
Scienza all'avanguardia spiegata semplicemente
Nuovo metodo migliora l'accuratezza nella misurazione della frequenza cardiaca nei video compressi.
― 6 leggere min
Questo studio svela come i modelli di sguardo personale influenzano le interazioni tra esseri umani e robot.
― 5 leggere min
Un'immersione profonda nei modelli di fondazione video e nel loro significato nell'analisi video.
― 7 leggere min
Scopri come DMD migliora il rilevamento del movimento nei flussi video per le applicazioni di sicurezza.
― 4 leggere min
CinePile sfida la comprensione di video lunghi con 305.000 domande diverse.
― 6 leggere min
BIMM impara i contenuti video imitanto i percorsi del cervello umano.
― 6 leggere min
JOSENet migliora il rilevamento in tempo reale della violenza nei filmati di sorveglianza usando metodi avanzati.
― 7 leggere min
Un nuovo metodo migliora la stima del movimento usando reti di elementi finiti adattive.
― 5 leggere min
Uno studio su come riconoscere le azioni usando il few-shot learning e dati multimodali.
― 5 leggere min
Nuovi metodi migliorano la comprensione delle interazioni dinamiche nei contenuti video.
― 7 leggere min
Il benchmark MLVU punta a migliorare la comprensione delle macchine per i video lunghi.
― 6 leggere min
Un nuovo metodo migliora l'accuratezza del rilevamento delle azioni in scene video sovrapposte.
― 7 leggere min
Un nuovo approccio alla segmentazione degli oggetti nei video migliora la precisione limitando l'uso della memoria.
― 8 leggere min
Un nuovo benchmark mira a valutare gli MLLM nella comprensione dei video su più argomenti.
― 7 leggere min
Un nuovo modello migliora la comprensione dei video unendo codificatori di immagini e video.
― 8 leggere min
VANE-Bench migliora la rilevazione delle anomalie nei video mentre cresce il contenuto generato dall'IA.
― 6 leggere min
Un nuovo dataset per migliorare la comprensione delle narrazioni nei cortometraggi.
― 7 leggere min
Un nuovo benchmark punta sulla composizionalità nella comprensione dei video e nei modelli linguistici.
― 6 leggere min
Introducendo un metodo per classificazioni video veloci basate sull'analisi dei primi fotogrammi.
― 5 leggere min
VideoVista offre una valutazione completa per i modelli di domanda-risposta su video.
― 6 leggere min
Un nuovo metodo migliora il riconoscimento delle azioni nei video usando il linguaggio contestuale.
― 8 leggere min
Un nuovo approccio migliora la previsione dei fotogrammi video usando conoscenze di dominio.
― 6 leggere min
La ricerca sottolinea il ruolo del video nel migliorare il riconoscimento vocale in ambienti rumorosi.
― 5 leggere min
DeepMoveSORT migliora l'efficienza del tracciamento degli oggetti, specialmente in scenari di movimento complessi.
― 4 leggere min
Un nuovo metodo migliora la gestione dei dati video per una comprensione e un'efficienza migliori.
― 5 leggere min
Un nuovo approccio migliora l'accuratezza nel rispondere a domande basate su video.
― 6 leggere min
Un nuovo metodo migliora il tracciamento degli oggetti gestendo la memoria in modo efficiente.
― 6 leggere min
FeatureSORT migliora l'accuratezza e la flessibilità del tracciamento in ambienti dinamici.
― 7 leggere min
VideoEval stabilisce un nuovo standard per valutare efficacemente i modelli fondamentali di video.
― 6 leggere min
Un nuovo metodo migliora la comprensione dell'AI riguardo ai contenuti video.
― 5 leggere min
TrCAM-V offre un modo nuovo per localizzare oggetti nei video usando informazioni minime.
― 5 leggere min
Un nuovo metodo migliora la segmentazione degli oggetti nei video con dati debolmente etichettati.
― 6 leggere min
Usare video non etichettati per migliorare il riconoscimento delle azioni in video lunghi.
― 6 leggere min
Usando la tecnologia NeRF per ricreare scene del crimine da filmati video.
― 5 leggere min
Combinare audio e informazioni visive migliora il riconoscimento degli oggetti nei video.
― 6 leggere min
Questo studio propone un nuovo metodo di valutazione per la comprensione video-testo.
― 6 leggere min
ActionSwitch rileva azioni nei video in streaming senza bisogno di informazioni di classe precedenti.
― 4 leggere min
LookupViT migliora i compiti di riconoscimento visivo tramite un'elaborazione efficiente dei token.
― 6 leggere min
Un nuovo approccio migliora la comprensione di video lunghi, affrontando sfide chiave.
― 6 leggere min
VARS usa l'analisi video per supportare gli arbitri a tutti i livelli del calcio.
― 5 leggere min