Deep-Learning-Methode zur Lokalisierung von Hornhautreflexionen
Eine neue Methode zur genauen Lokalisierung von Hornhautreflexionen in Augenbildern.
― 4 min Lesedauer
Inhaltsverzeichnis
In diesem Artikel besprechen wir eine neue Methode zur Auffindung eines bestimmten Reflexes in den Augenbildern, bekannt als Hornhautreflex (HR). Dieser Prozess ist wichtig für Technologien wie Eye-Tracker, die uns helfen zu verstehen, wohin jemand schaut. Traditionelle Methoden zur Bestimmung des Zentrums des HR basieren auf komplizierten Schritten und erfordern oft viel Zeit. Unsere Methode nutzt Deep Learning und Synthetische Daten, um diesen Prozess zu vereinfachen.
Hintergrund
Eye-Tracker funktionieren, indem sie die Pupille und den HR erkennen, um die Blickrichtung zu bestimmen. Viele hochwertige Systeme hängen von einer genauen Lokalisierung dieser Merkmale ab. Frühere Methoden hatten Probleme mit der Genauigkeit, besonders bei Bildrauschen. Die Notwendigkeit manueller Annotationen in echten Augenbildern machte das Trainieren von Modellen zudem schwierig. Wir schlagen eine Lösung für beide Probleme vor, indem wir synthetische Daten nutzen, um unser Modell zu trainieren.
Methodik
Unser Ansatz besteht darin, synthetische Augenbilder mit Hornhautreflexen zu erstellen. Wir verwenden ein Deep-Learning-Modell, um das Zentrum des HR in diesen Bildern zu finden. Unser Modell wird ausschliesslich mit synthetischen Daten trainiert, wodurch der zeitaufwendige Prozess der manuellen Kennzeichnung realer Bilder entfällt.
Modelltraining
Um unser Modell zu trainieren, haben wir Augenbilder mit verschiedenen Rauschpegeln und Hintergrunddetails erzeugt. Das Modell wurde so konzipiert, dass es die einzigartigen Merkmale des HR erkennt, selbst wenn sie auf unterschiedlichen Hintergründen überlagert sind. Wir haben unser Modell sowohl an synthetischen Bildern als auch an echten Augenbildern getestet, um die Effektivität zu bewerten.
Tests
Wir haben die Tests in zwei Hauptphasen durchgeführt. Zuerst haben wir überprüft, wie genau das Modell die HR-Zentren in synthetischen Bildern finden konnte. Nachdem wir die Leistung bestätigt hatten, haben wir das Modell auf echte Augenbilder angewendet, die während Fixationsaufgaben von Teilnehmern gesammelt wurden.
Ergebnisse
Unsere Tests haben gezeigt, dass unsere Deep-Learning-Methode das HR-Zentrum genauer lokalisieren konnte als traditionelle Methoden. Das galt sowohl für synthetische als auch für reale Bilder. Das Modell zeigte aussergewöhnliche Präzision, was entscheidend ist, um die Schätzaufgaben des Blicks zu verbessern.
Vergleich mit traditionellen Methoden
Im Vergleich zu bestehenden Techniken fanden wir heraus, dass unser Ansatz konstant bessere Ergebnisse hinsichtlich Genauigkeit und Präzision lieferte. Traditionelle Methoden wie Schwellenwertverfahren und radiale Symmetrie litten unter Einschränkungen, insbesondere in komplexen Hintergrundsituationen. Im Gegensatz dazu hielt unser Modell die hohe Leistung selbst unter herausfordernden Bedingungen aufrecht.
Anwendung auf echte Augenbilder
Wir haben unsere Methode auf echte Augenbilder angewendet, die von Teilnehmern gesammelt wurden. Die Ergebnisse bestätigten, dass das Modell HR-Zentren effektiv lokalisieren konnte und die traditionellen Techniken in Präzision übertraf. Diese Verbesserung führte zu einer höheren Datenqualität für Anwendungen im Blicktracking.
Implikationen
Die Fähigkeit, HR-Zentren genau zu lokalisieren, kann die Leistung von Eye-Trackern erheblich verbessern. Das ist besonders wichtig für Anwendungen, die eine detaillierte Analyse kleiner Augenbewegungen erfordern, wie Mikrosakkaden und langsame Verfolgungen. Je besser die Lokalisierung des HR-Zentrums, desto zuverlässiger werden die Blickdaten sein.
Zukünftige Richtungen
Obwohl unsere Methode vielversprechend ist, gibt es mehrere Bereiche für zukünftige Forschungen. Wir möchten den Ansatz ausweiten, um das Zentrum der Pupille zu lokalisieren, was die Qualität des Blicksignals weiter verbessern wird. Zudem wird das Testen unserer Methode in komplexeren Szenarien, wie mehreren HRs oder wechselnden Lichtbedingungen, helfen, ihre Robustheit zu beurteilen.
Fazit
Zusammenfassend haben wir eine neue, auf Deep Learning basierende Methode zur Lokalisierung des HR-Zentrums unter Verwendung synthetischer Daten vorgestellt. Dieser Ansatz vereinfacht den Trainingsprozess und verbessert die Genauigkeit, was ein wertvolles Werkzeug zur Verbesserung von Blickschätzmethoden bietet. Die Ergebnisse unserer Forschung zeigen das Potenzial von synthetischen Daten zur Ausbildung effektiver Modelle für Eye-Tracking-Anwendungen.
Titel: Precise localization of corneal reflections in eye images using deep learning trained on synthetic data
Zusammenfassung: We present a deep learning method for accurately localizing the center of a single corneal reflection (CR) in an eye image. Unlike previous approaches, we use a convolutional neural network (CNN) that was trained solely using simulated data. Using only simulated data has the benefit of completely sidestepping the time-consuming process of manual annotation that is required for supervised training on real eye images. To systematically evaluate the accuracy of our method, we first tested it on images with simulated CRs placed on different backgrounds and embedded in varying levels of noise. Second, we tested the method on high-quality videos captured from real eyes. Our method outperformed state-of-the-art algorithmic methods on real eye images with a 35% reduction in terms of spatial precision, and performed on par with state-of-the-art on simulated images in terms of spatial accuracy.We conclude that our method provides a precise method for CR center localization and provides a solution to the data availability problem which is one of the important common roadblocks in the development of deep learning models for gaze estimation. Due to the superior CR center localization and ease of application, our method has the potential to improve the accuracy and precision of CR-based eye trackers
Autoren: Sean Anthony Byrne, Marcus Nyström, Virmarie Maquiling, Enkelejda Kasneci, Diederick C. Niehorster
Letzte Aktualisierung: 2023-12-31 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2304.05673
Quell-PDF: https://arxiv.org/pdf/2304.05673
Lizenz: https://creativecommons.org/licenses/by-sa/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.