EgoObjects offre un ampio set di dati per capire gli oggetti da un punto di vista in prima persona.
― 7 leggere min
Scienza all'avanguardia spiegata semplicemente
EgoObjects offre un ampio set di dati per capire gli oggetti da un punto di vista in prima persona.
― 7 leggere min
Un nuovo metodo combina la previsione di salienza video e il rilevamento, migliorando le prestazioni.
― 6 leggere min
Questo studio presenta un metodo per classificare i video attraverso descrizioni testuali ricche.
― 6 leggere min
Un nuovo metodo migliora il modo in cui la tecnologia rileva il comportamento umano nei contesti di gruppo.
― 5 leggere min
MoDA migliora la segmentazione semantica nei video usando informazioni sul movimento.
― 5 leggere min
ProtoExplorer aiuta gli esperti forensi ad analizzare in modo efficace i video deepfake.
― 9 leggere min
Questo articolo spiega come usare le reti neurali per il riconoscimento delle scene nei film e nei programmi.
― 7 leggere min
Un nuovo metodo migliora il rilevamento delle anomalie nel traffico nei video di guida per la sicurezza.
― 5 leggere min
Il nuovo modello migliora il tracciamento e il riconoscimento del testo nei contenuti video.
― 4 leggere min
Un nuovo metodo per gestire dati complessi e dipendenti dal tempo in modo efficiente.
― 5 leggere min
Nuovi metodi aiutano i robot a imparare abilità in modo efficace guardando video di esperti.
― 8 leggere min
Presentiamo PRTreID, un metodo unificato per tracciare e identificare i giocatori nei video sportivi.
― 5 leggere min
Questo studio esplora come le macchine collegano le azioni ai loro risultati attraverso l'analisi video.
― 8 leggere min
Un framework per rendere le previsioni video comprensibili e affidabili.
― 6 leggere min
FineBio offre un dataset per tracciare le azioni negli esperimenti biologici tramite video.
― 7 leggere min
M-RAAP ottimizza l'abbinamento tra video e testo per risultati di ricerca migliori.
― 5 leggere min
Un nuovo metodo migliora la segmentazione audio-visiva senza etichette dettagliate.
― 6 leggere min
Un nuovo dataset migliora la capacità dell'AI di interpretare il comportamento umano nei video.
― 7 leggere min
Un dataset per valutare le difficoltà nei compiti di assemblaggio usando annotazioni video.
― 8 leggere min
UniVS semplifica i compiti di segmentazione video usando dei prompt per migliori prestazioni e versatilità.
― 7 leggere min
TV-TREES migliora il video question answering con strutture di ragionamento chiare.
― 5 leggere min
Questa ricerca esamina il passaggio da azioni intenzionali a quelle non intenzionali nei video.
― 4 leggere min
Un nuovo sistema identifica le azioni degli studenti nei video di classe con alta efficienza.
― 6 leggere min
Un nuovo metodo migliora il rilevamento delle relazioni nei video usando modelli specializzati.
― 8 leggere min
Un nuovo modello identifica i momenti divertenti nei video usando dati visivi, audio e di testo.
― 6 leggere min
Un approccio innovativo per riconoscere e localizzare i comportamenti di guida distratta.
― 9 leggere min
Un nuovo metodo migliora il question-answering video mantenendo le conoscenze pregresse.
― 6 leggere min
Mamba mostra un forte potenziale nell'analisi video rispetto ai transformer.
― 6 leggere min
HawkEye migliora i modelli video-testo per gestire video più lunghi in modo efficace.
― 6 leggere min
Un nuovo approccio semplifica il video grounding eliminando la necessità di etichette temporali precise.
― 7 leggere min
DINO Tracker migliora il tracciamento dei punti video, gestendo le occlusioni in modo efficace.
― 7 leggere min
Un nuovo metodo migliora l'identificazione di eventi insoliti nei video.
― 8 leggere min
Scopri come la potatura dei patch aumenta l'efficienza dei modelli di deep learning.
― 4 leggere min
Un nuovo approccio sfrutta i modelli linguistici per un'analisi efficiente di video lunghi.
― 6 leggere min
Un nuovo metodo migliora il riconoscimento delle azioni nei video non editati usando pochi esempi.
― 9 leggere min
Annolid automatizza il tracciamento degli animali nei video, aiutando i ricercatori a studiare il comportamento.
― 5 leggere min
Nuovi metodi migliorano il rilevamento delle azioni nei video contro varie corruzioni.
― 6 leggere min
Il modello ASTRA migliora la precisione nell'identificare le azioni durante le partite di calcio.
― 6 leggere min
DIBS migliora i sottotitoli degli eventi video perfezionando i confini usando dati non etichettati.
― 8 leggere min
Un nuovo metodo per identificare e descrivere oggetti nei video.
― 7 leggere min