EgoObjects bietet einen umfangreichen Datensatz, um Objekte aus der Ich-Perspektive zu verstehen.
― 7 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
EgoObjects bietet einen umfangreichen Datensatz, um Objekte aus der Ich-Perspektive zu verstehen.
― 7 min Lesedauer
Eine neue Methode kombiniert Video-Auffälligkeitsvorhersage und -erkennung und verbessert so die Leistung.
― 6 min Lesedauer
Diese Studie zeigt eine Methode, um Videos durch ausführliche Textbeschreibungen zu klassifizieren.
― 6 min Lesedauer
Eine neue Methode verbessert, wie Technik menschliches Verhalten in Gruppensituationen erkennt.
― 5 min Lesedauer
MoDA verbessert die semantische Segmentierung in Videos mithilfe von Bewegungsinformationen.
― 6 min Lesedauer
ProtoExplorer hilft Forensik-Experten dabei, Deepfake-Videos effektiv zu analysieren.
― 8 min Lesedauer
Dieser Artikel erklärt, wie man neuronale Netzwerke zur Szenenerkennung in Filmen und Shows verwendet.
― 7 min Lesedauer
Eine neue Methode verbessert die Erkennung von Verkehrsauffälligkeiten in Fahrvideos zur Sicherheit.
― 5 min Lesedauer
Neues Modell verbessert das Tracking und die Erkennung von Text in Videoinhalten.
― 4 min Lesedauer
Eine neue Methode, um komplexe zeitabhängige Daten effizient zu verwalten.
― 5 min Lesedauer
Neue Methoden helfen Robotern, Fähigkeiten effektiv zu lernen, indem sie Expertenvideos anschauen.
― 9 min Lesedauer
Wir stellen PRTreID vor, eine einheitliche Methode zum Verfolgen und Identifizieren von Spielern in Sportvideos.
― 4 min Lesedauer
Diese Studie untersucht, wie Maschinen Aktionen mit ihren Ergebnissen durch Videoanalyse verbinden.
― 8 min Lesedauer
Ein Rahmen, um Video-Vorhersagen verständlich und vertrauenswürdig zu machen.
― 6 min Lesedauer
FineBio bietet ein Datenset an, um Aktionen in biologischen Experimenten über Video zu verfolgen.
― 7 min Lesedauer
M-RAAP optimiert die Kombination von Video- und Textdaten für bessere Suchergebnisse.
― 6 min Lesedauer
Eine neue Methode verbessert die audio-visuelle Segmentierung ohne detaillierte Labels.
― 6 min Lesedauer
Ein neuer Datensatz verbessert die Fähigkeit von KI, menschliches Verhalten in Videos zu interpretieren.
― 7 min Lesedauer
Ein Datensatz zur Bewertung von Schwierigkeiten bei Montageaufgaben anhand von Videoannotations.
― 7 min Lesedauer
UniVS vereinfacht Video-Segmentierungsaufgaben mit Prompts für bessere Leistung und Vielseitigkeit.
― 6 min Lesedauer
TV-TREES verbessert die Video-Fragebeantwortung mit klaren Denkstrukturen.
― 5 min Lesedauer
Diese Forschung untersucht den Wechsel von absichtlichen zu unbeabsichtigten Handlungen in Videos.
― 4 min Lesedauer
Ein neues System erkennt Schüleraktionen in Klassenraumvideos mit hoher Effizienz.
― 6 min Lesedauer
Eine neue Methode verbessert die Erkennung von Beziehungen in Videos mithilfe spezialisierter Modelle.
― 8 min Lesedauer
Ein neues Modell erkennt witzige Momente in Videos, indem es visuelle, Audio- und Textdaten nutzt.
― 7 min Lesedauer
Ein innovativer Ansatz, um abgelenktes Fahren zu erkennen und zu lokalisieren.
― 9 min Lesedauer
Eine neue Methode verbessert das Video-Fragenbeantworten und behält dabei das vorherige Wissen.
― 6 min Lesedauer
Mamba zeigt im Vergleich zu Transformern ein starkes Potenzial in der Videoanalyse.
― 6 min Lesedauer
HawkEye verbessert Video-Text-Modelle, um längere Videos effektiv zu verarbeiten.
― 6 min Lesedauer
Ein neuer Ansatz vereinfacht die Videozuordnung, indem er die Notwendigkeit für präzise Zeitstempel eliminiert.
― 8 min Lesedauer
DINO Tracker verbessert das Video-Punkt-Tracking und geht gut mit Unterbrechungen um.
― 7 min Lesedauer
Neue Methode verbessert die Identifizierung ungewöhnlicher Ereignisse in Videoaufnahmen.
― 8 min Lesedauer
Lern, wie Patch-Pruning die Effizienz von Deep-Learning-Modellen steigert.
― 4 min Lesedauer
Ein neuer Ansatz nutzt Sprachmodelle für eine effiziente Analyse von langen Videos.
― 5 min Lesedauer
Eine neue Methode verbessert die Aktionskennung in ungeschnittenen Videos mit wenigen Beispielen.
― 9 min Lesedauer
Annolid automatisiert die Tierverfolgung in Videos und hilft Forschern dabei, das Verhalten zu studieren.
― 5 min Lesedauer
Neue Methoden verbessern die Erkennung von Videoaktionen gegen verschiedene Verzerrungen.
― 6 min Lesedauer
Das ASTRA-Modell verbessert die Genauigkeit bei der Identifizierung von Aktionen während Fussballspielen.
― 6 min Lesedauer
DIBS verbessert die Beschriftung von Videoereignissen, indem es Grenzen mit ungelabelten Daten verfeinert.
― 7 min Lesedauer
Eine neue Methode zur Identifizierung und Beschreibung von Objekten in Videos.
― 6 min Lesedauer