Der Dynamic Mobile-Former verbessert die Effizienz und Leistung der Computer Vision mit dynamischer Faltung.
― 6 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
Der Dynamic Mobile-Former verbessert die Effizienz und Leistung der Computer Vision mit dynamischer Faltung.
― 6 min Lesedauer
Ein innovativer Ansatz, um Videos ohne vorherige Beispiele oder Training auszurichten.
― 4 min Lesedauer
Ein neuer Ansatz bringt 3D-Punktwolken ohne beschriftete Daten in Einklang.
― 5 min Lesedauer
KD-DLGAN verbessert die Bildgenerierungsqualität durch Wissensdistillation.
― 6 min Lesedauer
Neue Methoden erkunden, um das Lernen aus begrenzten Daten zu verbessern.
― 5 min Lesedauer
Der RoboBEV-Benchmark bewertet BEV-Systeme im Vergleich zu realen Herausforderungen.
― 8 min Lesedauer
SpectFormer kombiniert spektrale und Aufmerksamkeits-Schichten für eine bessere Bildanalyse.
― 5 min Lesedauer
Dieses Framework nutzt Anpassungen zur Testzeit für bessere Vorhersagen von menschlichen Bewegungen.
― 6 min Lesedauer
Eine neue Methode identifiziert Aktionen in Videos, ohne vorab beschriftete Daten zu brauchen.
― 5 min Lesedauer
Hierarchisches Prompting verbessert die Genauigkeit und Effizienz der Bildklassifikation durch strukturierte Kennzeichnung.
― 7 min Lesedauer
Neue Techniken verbessern die Tiefenvorhersage aus einzelnen Bildern.
― 6 min Lesedauer
Die Forschung zielt darauf ab, die Datenrepräsentation mit nichtlinearen Methoden und zeitlichen Strukturen zu verbessern.
― 7 min Lesedauer
EWT kombiniert Wavelet-Transformationen und Transformer für verbesserte Bildklarheit und Effizienz.
― 6 min Lesedauer
Ein neuer Ansatz, um unlabelte Bilder effektiv zu kategorisieren.
― 6 min Lesedauer
Eine neue Methode verbessert die VPR-Genauigkeit, indem sie zusätzliche Referenzbilder erzeugt.
― 5 min Lesedauer
Eine neue Methode verbessert die Aktionskennung mit teilweise gekennzeichneten Daten.
― 5 min Lesedauer
Lern, wie Smooth IoU Loss die Genauigkeit von Objekterkennung verbessert.
― 5 min Lesedauer
PARFormer verbessert die Fussgängererkennung mit Transformern für bessere Genauigkeit.
― 6 min Lesedauer
Dieses Verfahren verbessert die Schätzung des optischen Flusses, ohne auf gelabelte Daten angewiesen zu sein.
― 6 min Lesedauer
Ein System, das Bilder mit Wortbedeutungen anhand des Kontexts abgleicht.
― 7 min Lesedauer
Ein neuer Wettbewerb hat Fortschritte beim Messen von Tiefe mit Einzelbildern gezeigt.
― 5 min Lesedauer
Die Kombination von LIDAR mit Graustufenbildern steigert die Genauigkeit und spart Energie.
― 5 min Lesedauer
Eine neuartige Methode kombiniert sichtbares Licht und thermische Bilder, um die Klassifikationsgenauigkeit zu verbessern.
― 6 min Lesedauer
Eine neue Methode verbessert die Genauigkeit der Objekterkennung, indem sie Probleme mit der Vorhersagesicherheit angeht.
― 5 min Lesedauer
Ein neues Framework verbessert die Erkennung in überfüllten Umgebungen, obwohl die Sicht blockiert ist.
― 5 min Lesedauer
Ein neuer Ansatz zur Verbesserung der Objektrekonstruktion hinter spiegelnden Oberflächen.
― 5 min Lesedauer
Eine neuartige Methode verbessert die Videofragebeantwortung mithilfe von Situationshypergraphen.
― 7 min Lesedauer
ProPanDL verbessert die panoptische Segmentierung, indem es Unsicherheit bei der Objekterkennung einbezieht.
― 5 min Lesedauer
Eine neue Methode verbessert die Genauigkeit der Raumlayout-Schätzung für entfernte Wände.
― 6 min Lesedauer
Untersuchen, wie synthetische Daten die Genauigkeit der Bildklassifikation bei ImageNet verbessern.
― 5 min Lesedauer
Ein neuartiger Ansatz, um realistische Bilder nur mit zwei Fotos zu erstellen.
― 6 min Lesedauer
Wir stellen EVAD vor, ein Verfahren für schnellere und genauere Videoaktionsdetektion.
― 6 min Lesedauer
Ein neuer Tracker identifiziert und verfolgt effizient verschiedene Objekte in Videos.
― 8 min Lesedauer
Erforschen von Fortschritten im Deep Learning bei omnidirektionalen Kameratechnologien für verschiedene Anwendungen.
― 7 min Lesedauer
Neue Ansätze zur Erkennung menschlicher Posen mit omnidirektionalen Bildern zeigen vielversprechende Ergebnisse.
― 6 min Lesedauer
Ein neues Verfahren verbessert die Genauigkeit der PCB-Inspektion durch die Nutzung mehrerer Winkel.
― 6 min Lesedauer
Eine neue Methode verbessert das Tracking der Kameraposition bei kniffligen chirurgischen Eingriffen.
― 7 min Lesedauer
Eine neue Methode verbessert das Lernen aus nicht objektzentrierten Bildern durch geometrische Sensitivität.
― 6 min Lesedauer
Eine Studie, die die Vertrauenswürdigkeit von visuellen Erklärungen in neuronalen Netzwerken untersucht.
― 6 min Lesedauer
Untersuchen, wie Deep-Learning-Systeme Objekte mit begrenzten Blickwinkeln erkennen.
― 7 min Lesedauer