Ein System, das Geräusche mit visuellen Eindrücken verbindet und dadurch das Verständnis von Maschinen verbessert.
― 7 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Ein System, das Geräusche mit visuellen Eindrücken verbindet und dadurch das Verständnis von Maschinen verbessert.
― 7 min Lesedauer
TAPVid-3D Benchmark verbessert das 3D-Punkt-Tracking für Robotik und Videoanwendungen.
― 8 min Lesedauer
AutoAD-Zero nutzt visuelle Hinweise für schnellere, effektive Audiodeskriptionen.
― 7 min Lesedauer
Magiv2 hat das Ziel, den Zugang zu Manga für sehbehinderte Menschen durch automatisierte Transkripte zu verbessern.
― 6 min Lesedauer
Eine neue Methode verbessert die Objekterkennung in Videos aus der Ich-Perspektive mit 3D-Bewusstsein.
― 6 min Lesedauer
Ein Überblick über die Fortschritte in der Sprechererkennung durch die VoxCeleb Challenge.
― 5 min Lesedauer
Entdecke die faszinierende Wissenschaft hinter den Geräuschen des Einschenkens von Getränken.
― 6 min Lesedauer
Entdecke, wie Maschinen aus Videos lernen, um Bewegung und Tiefe zu verstehen.
― 7 min Lesedauer