YOWOv3 migliora il rilevamento delle azioni nei video con efficienza e precisione.
― 5 leggere min
Scienza all'avanguardia spiegata semplicemente
YOWOv3 migliora il rilevamento delle azioni nei video con efficienza e precisione.
― 5 leggere min
COM Kitchens offre video di cucina non editati per studiare i processi di preparazione del cibo.
― 5 leggere min
MATR migliora il rilevamento delle azioni in flussi video non modificati tramite tecnologia aumentata dalla memoria.
― 7 leggere min
mPLUG-Owl3 migliora la comprensione delle immagini e dei video per risposte migliori.
― 7 leggere min
Nuovo approccio migliora la classificazione delle azioni usando il contesto storico nei video.
― 7 leggere min
Questo framework migliora la localizzazione delle azioni nei video usando rappresentazioni probabilistiche e contesto.
― 5 leggere min
Un metodo per riassumere video da diverse culture e fonti di notizie.
― 5 leggere min
I benchmark attuali non valutano bene la capacità dei modelli di collegare dati audio e visivi.
― 6 leggere min
Un nuovo metodo migliora il tracciamento degli oggetti nei video in prima persona usando la consapevolezza 3D.
― 6 leggere min
Nuovi metodi migliorano l'accuratezza e l'efficienza della segmentazione video per diverse applicazioni.
― 6 leggere min
Nuovi metodi migliorano il riconoscimento delle azioni nei video grazie a tecniche di allenamento innovative.
― 5 leggere min
Esaminando il potere dei modelli di base nei compiti di tracciamento dei punti.
― 6 leggere min
Un nuovo metodo trova eventi video usando grandi modelli pre-addestrati senza addestramento specifico.
― 7 leggere min
Questo studio migliora il riconoscimento delle azioni unendo le mappe di profondità con i frame video RGB.
― 5 leggere min
ConsistencyTrack migliora il tracciamento degli oggetti nei video usando tecniche innovative per gestire il rumore.
― 6 leggere min
Un nuovo approccio migliora la rilevazione delle azioni nei video affrontando il problema del collasso dell'attenzione.
― 6 leggere min
Tecniche innovative migliorano la rilevazione dei video deepfake in mezzo a una tecnologia in continua evoluzione.
― 4 leggere min
FinePseudo migliora il riconoscimento delle azioni dettagliate usando meno esempi etichettati.
― 7 leggere min
ViDiDi migliora l'apprendimento video grazie all'uso efficace di dati non etichettati.
― 7 leggere min
Un nuovo metodo migliora il tracciamento degli oggetti nei video usando solo una telecamera.
― 7 leggere min
Un nuovo metodo migliora le previsioni dei movimenti delle mani nei video per robot e realtà virtuale.
― 6 leggere min
Questo framework sfrutta immagini statiche per creare un efficace addestramento dei modelli video.
― 6 leggere min
Un nuovo metodo migliora la precisione nel tracciare il movimento umano dai video.
― 5 leggere min
SoccerNet 2024 sfide spingono l'innovazione nella comprensione video per il calcio.
― 5 leggere min
Un nuovo modo di capire le relazioni tra variabili in ambienti che cambiano.
― 6 leggere min
La ricerca si concentra sul migliorare la capacità dell'IA di riconoscere azioni nei video.
― 6 leggere min
Un nuovo framework migliora il rilevamento delle relazioni tra oggetti nei video, aumentando precisione e adattabilità.
― 6 leggere min
Un nuovo approccio migliora il video question answering grazie al riconoscimento del testo nelle scene.
― 7 leggere min
Walker offre un tracciamento degli oggetti efficiente con una minima etichettatura dei dati.
― 6 leggere min
Il framework Temporal2Seq semplifica molteplici compiti di comprensione video in un unico modello.
― 8 leggere min
VideoLISA usa il linguaggio per segmentare e tenere traccia degli oggetti nei video in modo efficace.
― 7 leggere min
Un benchmark che valuta la capacità dei LMM di analizzare la qualità video.
― 7 leggere min
Nuovo framework migliora la comprensione video in condizioni di scarsa illuminazione usando telecamere a eventi.
― 6 leggere min
Un nuovo sistema identifica errori in tempo reale durante le attività tramite analisi video.
― 4 leggere min
Un nuovo metodo accelera il riconoscimento delle azioni nei video con meno dati.
― 6 leggere min
UniHOI fa progressi nello studio dell'interazione uomo-oggetto nei video.
― 5 leggere min
Un nuovo sistema migliora il riconoscimento delle azioni nei video usando Modelli Linguistici Multimodali di Grandi Dimensioni.
― 7 leggere min
Usare il machine learning per valutare i movimenti dei neonati per avere intuizioni precoci sullo sviluppo.
― 6 leggere min
Scopri come i riassunti video migliorano la supervisione umana dei robot.
― 5 leggere min
Un sistema che rileva azioni di guida distratta usando un'analisi video avanzata.
― 8 leggere min