ReLoc-PDR: Eine neue Ära in der Indoor-Navigation
ReLoc-PDR kombiniert Methoden, um die Genauigkeit der Navigation von Fussgängern in Innenräumen zu verbessern.
― 8 min Lesedauer
Inhaltsverzeichnis
Die indoor Fussgängernavigation ist wichtig für viele Dienste, die auf Standorte angewiesen sind. Zu wissen, wo jemand drinnen ist, kann in Notfällen helfen, Leute zu leiten und Augmented-Reality-Erlebnisse zu schaffen. Traditionelle Methoden, die auf spezielle Ausrüstung angewiesen sind, haben oft Probleme mit Signalstörungen und hohen Einrichtungskosten.
Pedestrian Dead Reckoning (PDR) nutzt nur Bewegungsdaten von Smartphones, um den Standort einer Person zu schätzen, was in verschiedenen Umgebungen gut funktioniert. Allerdings kann die Genauigkeit von PDR im Laufe der Zeit abnehmen, aufgrund von Störungen in den Sensoren. Um das zu verbessern, haben Forscher versucht, PDR mit anderen Methoden wie WiFi oder Bluetooth zu kombinieren. Diese brauchen oft zusätzliche Ausrüstung und eine sorgfältige Einrichtung.
Visuelle Relokalisation ist eine weitere Methode, die die Position einer Person anhand von Kamerabildern schätzen kann. Da die meisten Smartphones Kameras haben, bietet diese Methode eine gute Alternative. Das Hauptproblem bei der visuellen Relokalisation ist, dass sie von Änderungen im Licht und anderen Umweltfaktoren beeinflusst werden kann.
Die Kombination von visueller Relokalisation und PDR bietet eine vielversprechende Lösung. PDR kann Fehler, die bei der visuellen Relokalisation gemacht werden, korrigieren und umgekehrt. Allerdings stehen die bestehenden Methoden zur Kombination dieser beiden immer noch vor Herausforderungen, besonders unter schwierigen Bedingungen, in denen visuelle Beobachtungen unbeständig sein können.
Vorgeschlagenes System: ReLoc-PDR
Um diese Probleme anzugehen, wurde ein neues System namens ReLoc-PDR entwickelt. Dieses System kombiniert PDR mit visueller Relokalisation, um eine zuverlässigere Möglichkeit zu bieten, den Standort einer Person zu bestimmen. ReLoc-PDR nutzt fortschrittliche Techniken, um sicherzustellen, dass das Abgleichen visueller Merkmale effektiv ist und der Lokalisierungsprozess stabil bleibt.
Das System besteht aus drei Hauptteilen: PDR, visueller Relokalisation und einer Methode zur Zusammenführung der Positionen, die von beiden Systemen geschätzt werden. Das PDR-Modul verwendet Daten von den Sensoren des Smartphones, um die Position der Person Schritt für Schritt zu berechnen. Das Modul zur visuellen Relokalisation schätzt die Position anhand von Bildern, die mit der Smartphone-Kamera aufgenommen wurden. Schliesslich kombiniert das Fusionsmodul die Ergebnisse beider Methoden, um eine flüssige und genaue Schätzung der Trajektorie der Person zu erstellen.
Systemdesign
Der ReLoc-PDR-Rahmen ist darauf ausgelegt, PDR zu nutzen, um die Position basierend auf Bewegungen zu berechnen. Die visuelle Komponente funktioniert, indem sie ein neues Bild von der Smartphone-Kamera mit einer 3D-Karte bekannter Merkmale vergleicht. So kann es Fehler von PDR korrigieren.
Das Fusionsmodul verwendet eine Methode namens Graphoptimierung, um die Ergebnisse beider Systeme zu integrieren. Dadurch können fortlaufende Updates der geschätzten Position basierend auf der Zuverlässigkeitsbewertung der visuellen Beobachtungen erfolgen. Das System zielt darauf ab, eine genaue und nahtlose Navigation selbst in herausfordernden Umgebungen zu bieten.
Wie PDR funktioniert
PDR schätzt Bewegungen mithilfe von Messungen von Smartphone-Sensoren. Der Prozess kann in vier Hauptschritte unterteilt werden: erkennen, wann ein Schritt gemacht wird, die Entfernung jedes Schrittes schätzen, die Richtung bestimmen und die Gesamtposition aktualisieren.
Schritt-Erkennung
Um Schritte zu erkennen, schaut das System nach Mustern in den Beschleunigungsdaten, während eine Person läuft. Durch das Setzen von Schwellenwerten für Beschleunigungswerte kann das System jeden gemachten Schritt genau identifizieren.
Schrittlängen-Schätzung
Als Nächstes schätzt das System, wie weit sich eine Person mit jedem Schritt bewegt. Dies wird von der Gehweise der Person beeinflusst, daher verwendet die Methode ein Modell, um die Schätzung basierend auf den Sensorwerten anzupassen.
Richtungsbestimmung
Es ist auch wichtig zu bestimmen, in welche Richtung sich eine Person bewegt. Dies geschieht mithilfe des Gyroskops des Smartphones, das Änderungen der Orientierung während des Laufens verfolgen kann.
Positionsaktualisierung
Nachdem die Schrittlänge und die Richtung geschätzt wurden, aktualisiert das System den Standort basierend auf diesen Berechnungen. Dieser Prozess erfolgt kontinuierlich, während sich die Person bewegt.
Visuelle Relokalisation erklärt
Die visuelle Relokalisation, oder bildbasierte Lokalisierung, schätzt die Position anhand von Bildern, die mit dem Smartphone aufgenommen wurden. Es gibt zwei Hauptstrategien: abrufbasierte und strukturierte Methoden.
Abrufbasierte Methoden
Diese Methoden schätzen die Position, indem sie das ähnlichste Bild in einer Datenbank finden und dessen bekannten Standort verwenden. Während dies schnell ist, fehlt es oft an Genauigkeit.
Strukturierte Methoden
Strukturierte Methoden versuchen, Merkmale im neuen Bild mit einem detaillierten 3D-Modell zu vergleichen, das aus vorherigen Bildern erstellt wurde. Dieser Ansatz kann genauer sein, ist jedoch komplex und kann in Bereichen mit wenigen markanten Merkmalen Schwierigkeiten haben.
Herausforderungen mit traditionellen Methoden
Sowohl PDR als auch visuelle Relokalisation stehen vor Einschränkungen, besonders in Umgebungen, die keine klaren visuellen Hinweise bieten oder ungünstige Lichtverhältnisse haben. Die Herausforderung besteht darin, sicherzustellen, dass das System auch unter diesen Umständen effektiv funktioniert.
Kombination von PDR und visueller Relokalisation
Die Integration dieser beiden Methoden verbessert die Genauigkeit und Zuverlässigkeit. Wenn die Schätzungen des PDR im Laufe der Zeit weniger genau werden, kann die visuelle Relokalisation helfen, die Position basierend auf visuellen Daten zurückzusetzen.
Allerdings können bestehende Methoden zur Kombination mit inkonsistenten visuellen Daten kämpfen, was zu Fehlern bei der Positionierung führen kann. Daher ist ein besserer Integrationsansatz notwendig.
Der ReLoc-PDR-Rahmen
ReLoc-PDR wurde speziell entwickelt, um die häufigsten Probleme seiner Vorgänger zu lösen. So funktioniert es:
PDR-Modul
Das PDR-Modul verfolgt kontinuierlich die Bewegungen einer Person, indem es die inertialen Sensoren im Smartphone nutzt. Dieser Teil des Systems ist dafür verantwortlich, die grundlegenden Positionsupdates basierend auf Bewegungen zu berechnen.
Modul zur visuellen Relokalisation
Der Teil zur visuellen Relokalisation verwendet Bilder, die mit dem Smartphone aufgenommen wurden, um die aktuelle Position im Vergleich zu einer bekannten Karte zu finden. Durch den Vergleich von Merkmalen aus dem aktuellen Bild mit denen, die in einer Datenbank von vorherigen Bildern gespeichert sind, kann es effektiv schätzen, wo sich die Person befindet.
Fusion von PDR und visueller Relokalisation
Die Innovation von ReLoc-PDR liegt in seiner Fähigkeit, die Ergebnisse aus beiden Modulen effizient zusammenzuführen. Durch die Verwendung von Graphoptimierung kann das System das Gewicht der visuellen Informationen basierend auf deren Zuverlässigkeit anpassen. Das ermöglicht es ihm, flexibel zu sein und sich wechselnden Bedingungen anzupassen.
Datenfluss in ReLoc-PDR
In der Praxis sammelt das ReLoc-PDR-System Daten von den Sensoren und der Kamera des Smartphones. Hier ist eine vereinfachte Sicht darauf, wie die Daten durch das System fliessen:
- Sensor-Datensammlung: Das System sammelt Beschleunigungs- und Gyroskopdaten, um den PDR-Algorithmus auszuführen.
- Schritt-Erkennung: Wenn ein Schritt erkannt wird, wird ein Bild mit der Smartphone-Kamera aufgenommen.
- Visuelle Relokalisation: Das aufgenommene Bild wird mit der vorab erstellten 3D-Karte verglichen, um die Position zu schätzen.
- Pose-Fusion: Schliesslich werden die Ergebnisse von PDR und visueller Relokalisation kombiniert, um eine genaue und kontinuierliche Positionsschätzung zu bieten.
Dieser Prozess ermöglicht es dem System, verschiedene Bedingungen zu bewältigen, auch solche mit eingeschränkter Sicht oder schlechten Texturen.
Verbesserungen durch Deep Learning
Jüngste Fortschritte im Deep Learning haben die visuelle Relokalisation des Systems erheblich verbessert. Durch die Verwendung von gelernten Merkmalen anstelle von traditionellen handgefertigten kann ReLoc-PDR eine bessere Genauigkeit und Zuverlässigkeit erreichen, selbst in schwierigen Umgebungen.
Gelernt Globale Deskriptoren für die Bildabfrage
Mit fortschrittlichen Modellen kann das System Merkmale aus Bildern extrahieren, die helfen, schnell ähnliche Referenzen aus seiner Datenbank zu finden. Dies verbessert die Geschwindigkeit und Leistung des visuellen Relokalisation-Schrittes.
Gelernt Lokale Merkmale für das Matching
Die Integration von gelernten Merkmalen verbessert auch den Matching-Prozess zwischen dem aufgenommenen Bild und dem 3D-Modell, was die Genauigkeit weiter erhöht.
Robuste Positionsschätzung
Um die Pose genau zu schätzen, verwendet ReLoc-PDR eine robuste Methode, um sicherzustellen, dass selbst wenn einige visuelle Beobachtungen falsch sind, sie die Endpositionsergebnisse nicht erheblich beeinflussen. Diese Anpassungsfähigkeit hilft, die Stabilität im gesamten Positionierungssystem zu erhalten.
Bewertung von ReLoc-PDR
Um ReLoc-PDR zu testen, wurden Experimente in verschiedenen herausfordernden Umgebungen durchgeführt, darunter:
Innenräume
Experimente in Innenräumen, wie Fluren mit wenig Textur oder Hindernissen wie sich bewegenden Personen, zeigten, dass ReLoc-PDR besser abschneidet als andere Ansätze. Die Methode korrigierte effektiv Fehler von PDR mithilfe der visuellen Daten.
Aussenbereiche
Tests unter wechselnden äusseren Bedingungen, wie bewölktem Wetter und unterschiedlichen Lichtverhältnissen, hoben ebenfalls die Leistung von ReLoc-PDR hervor. Selbst wenn die Umgebung Herausforderungen bot, behielt das System eine flüssige und genaue Trajektorie bei.
Nachtbedingungen
Schliesslich wurde das System unter schlechten Lichtverhältnissen bewertet, in denen traditionelle Methoden Schwierigkeiten hatten. Die Verwendung von gelernten Merkmalen von ReLoc-PDR lieferte bessere Ergebnisse und zeigte seine Robustheit in schwierigen Situationen.
Fazit
ReLoc-PDR stellt einen bedeutenden Fortschritt in der Fussgängernavigation dar, insbesondere in Umgebungen, in denen traditionelle Methoden versagen könnten. Durch die effektive Kombination von PDR mit visueller Relokalisation bietet es eine zuverlässige und kontinuierliche Möglichkeit, den Standort mithilfe von Smartphone-Technologie zu bestimmen. Experimentelle Ergebnisse bestätigen die Effektivität in verschiedenen Szenarien, was es zu einem wertvollen Tool zur Verbesserung von standortbasierten Diensten macht.
Titel: ReLoc-PDR: Visual Relocalization Enhanced Pedestrian Dead Reckoning via Graph Optimization
Zusammenfassung: Accurately and reliably positioning pedestrians in satellite-denied conditions remains a significant challenge. Pedestrian dead reckoning (PDR) is commonly employed to estimate pedestrian location using low-cost inertial sensor. However, PDR is susceptible to drift due to sensor noise, incorrect step detection, and inaccurate stride length estimation. This work proposes ReLoc-PDR, a fusion framework combining PDR and visual relocalization using graph optimization. ReLoc-PDR leverages time-correlated visual observations and learned descriptors to achieve robust positioning in visually-degraded environments. A graph optimization-based fusion mechanism with the Tukey kernel effectively corrects cumulative errors and mitigates the impact of abnormal visual observations. Real-world experiments demonstrate that our ReLoc-PDR surpasses representative methods in accuracy and robustness, achieving accurte and robust pedestrian positioning results using only a smartphone in challenging environments such as less-textured corridors and dark nighttime scenarios.
Autoren: Zongyang Chen, Xianfei Pan, Changhao Chen
Letzte Aktualisierung: 2023-09-04 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2309.01646
Quell-PDF: https://arxiv.org/pdf/2309.01646
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.