TransNet bietet eine effiziente Lösung zur Erkennung menschlicher Aktionen in Videodaten.
― 5 min Lesedauer
Hochmoderne Wissenschaft einfach erklärt
TransNet bietet eine effiziente Lösung zur Erkennung menschlicher Aktionen in Videodaten.
― 5 min Lesedauer
DEFormer verbessert die Bildqualität bei schwachem Licht mit Hilfe von Frequenzdaten.
― 5 min Lesedauer
Neue Techniken verbessern das kontinuierliche Lernen in unüberwachten Einstellungen.
― 6 min Lesedauer
Eine Methode zur Verbesserung der Qualitätskontrolle durch Erkennung von Mängeln in Holzprodukten.
― 7 min Lesedauer
Eine neue Methode verbessert die Bilderkennung mit massgeschneiderten Textbeschreibungen.
― 7 min Lesedauer
Die Forschung konzentriert sich darauf, Bewegungsbias im SLAM zu reduzieren, um die Zuverlässigkeit zu verbessern.
― 6 min Lesedauer
Untersuchen, wie neuronale Netze bewegte Bilder ähnlich wie das menschliche Gehirn darstellen.
― 6 min Lesedauer
Ein Datensatz zur Bewertung von Objektrekonstruktionsmethoden unter verschiedenen Lichtbedingungen.
― 6 min Lesedauer
Neue Technik verbessert 3D-Modellierung von Händen und Objekten aus Einzelbildern.
― 6 min Lesedauer
Ein neuer Ansatz verbessert die Aufgabenleistung in Vision-Sprachmodellen.
― 6 min Lesedauer
Ein neues Framework verbessert Sprachmodelle, indem es Text und Bilder kombiniert für abwechslungsreichere Interaktionen.
― 4 min Lesedauer
Erfahre, wie Padding Aware Neuronen die Bildverarbeitung in Machine Learning Modellen beeinflussen.
― 5 min Lesedauer
Das aufstrebende Ensemble-Architektur verbessert die Zuverlässigkeit und Genauigkeit der Objekterkennung.
― 5 min Lesedauer
IA-ViT verbessert die Erklärungsqualität bei visuellen Aufgaben.
― 7 min Lesedauer
Neue Datenquelle verbessert Maschinenlernmodelle bei Denkaufgaben.
― 7 min Lesedauer
MoCo-SAS nutzt selbstüberwachtes Lernen für eine verbesserte Erkennung von Unterwasserobjekten.
― 7 min Lesedauer
TEMPO verbessert die Körperhaltungsschätzung, indem es Bewegungen in Echtzeit verfolgt und vorhersagt.
― 5 min Lesedauer
Eine neue Methode verbessert die Genauigkeit bei der Schätzung der Kopfhaltung in verschiedenen Orientierungen.
― 6 min Lesedauer
Roboter nutzen Bilder, um Objekte zu erkennen und zu manipulieren, was die Interaktionen zu Hause verbessert.
― 6 min Lesedauer
Dieser Artikel bespricht Möglichkeiten, die Zuverlässigkeit von KI-Modellen in sich verändernden Umgebungen zu verbessern.
― 6 min Lesedauer
Dieser Artikel behandelt Salient Channel Tuning, eine Methode zur effizienten Feinabstimmung grosser Modelle.
― 5 min Lesedauer
Eine neue Methode hilft Robotern, sicher durch raues Gelände zu navigieren, indem sie Luftbilder nutzen.
― 5 min Lesedauer
Dieser Artikel untersucht Geschlechtervorurteile in Vision-Transformern im Vergleich zu CNNs.
― 5 min Lesedauer
Eine neue Methode verringert den Aufwand für die Erstellung von Skizzen bei Bildabrufaufgaben.
― 6 min Lesedauer
Das YCB-Ev-Dataset verbessert die Posenabschätzung mit RGB-D- und Eventkamera-Daten.
― 5 min Lesedauer
Neue Methode erzeugt ausgewogene Datensätze für faire Gesichtserkennungstechnologie.
― 6 min Lesedauer
Ein neuer Ansatz, um die Effektivität der Bildabrufung und des Trainings zu verbessern.
― 6 min Lesedauer
Eine neue Methode kombiniert Video-Auffälligkeitsvorhersage und -erkennung und verbessert so die Leistung.
― 6 min Lesedauer
Studie zeigt Auswirkungen von globalen und Rolling-Shutters auf die Fussgängererkennung.
― 6 min Lesedauer
Ein neues Framework verbessert die Genauigkeit bei der 3D-Datenanpassung über verschiedene Sensoren hinweg.
― 6 min Lesedauer
Die Rolle von GNNs bei der Verarbeitung von Punktwolken-Daten erkunden.
― 5 min Lesedauer
Dieser Artikel bespricht die Rolle der BEV-Wahrnehmung in der Technologie des autonomen Fahrens.
― 7 min Lesedauer
Visuelle Daten mit Funktechnologie kombinieren, um die Effizienz des Beam-Trainings zu verbessern.
― 7 min Lesedauer
Ein effizientes Multi-Class-Labeling-Verfahren für die semantische Segmentierung.
― 7 min Lesedauer
Das RenderIH-Datensatz verbessert die Genauigkeit beim Verständnis von menschlichen Handinteraktionen.
― 6 min Lesedauer
LiteTrack kombiniert Geschwindigkeit und Genauigkeit für die Objekterkennung in verschiedenen Anwendungen.
― 6 min Lesedauer
Eine neue Methode verbessert die Normalenbestimmung in 3D-Punktwolken.
― 5 min Lesedauer
Ein neuer Ansatz verbessert die Genauigkeit bei der Beantwortung von bildbezogenen Fragen.
― 5 min Lesedauer
Forschung zur Erkennung ungewöhnlicher Objekte in autonomen Fahrzeugen durch fortschrittliche Bildgebungstechniken.
― 5 min Lesedauer
Eine neue Methode verbessert die Videoobjekterkennung ohne beschriftete Daten.
― 6 min Lesedauer