Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Netzwerke und Internet-Architektur# Kryptographie und Sicherheit

Neuer Datensatz zeigt Einblicke in Wi-Fi-Probeanfragen

Ein umfassender Datensatz beleuchtet Wi-Fi-Probeanfragen und den Datenschutz der Nutzer.

― 6 min Lesedauer


Wi-Fi Probe-Anfrage DatenWi-Fi Probe-Anfrage DatenEinblickeund Datenschutzrisiken.Neue Erkenntnisse über Wi-Fi-Verhalten
Inhaltsverzeichnis

Dieser Artikel behandelt einen neuen Datensatz zu Probe-Anfragen in Wi-Fi-Netzwerken. Probe-Anfragen sind Signale, die von Geräten gesendet werden, um nahegelegene Wi-Fi-Netzwerke zu finden. Diese Infos sind wichtig, da sich die Technologie ständig verändert. Der Datensatz wurde über einen Monat in einem Büro gesammelt und umfasst über 1,4 Millionen Probe-Anfragen. Ziel dieser Arbeit ist es, Forschern und Entwicklern aktualisierte Daten zu liefern, um verschiedene Aspekte der Wi-Fi-Kommunikation und der Privatsphäre der Nutzer zu untersuchen.

Was sind Probe-Anfragen?

Probe-Anfragen sind Teil des Wi-Fi-Kommunikationsprozesses. Wenn ein Gerät sich mit einem Wi-Fi-Netzwerk verbinden möchte, sendet es Probe-Anfragen aus, um nahegelegene Zugangspunkte (APs) zu finden. APs sind Geräte, die es ermöglichen, sich mit einem Wi-Fi-Netzwerk zu verbinden. Probe-Anfragen sind unverschlüsselt, was bedeutet, dass sie von jedem mit der richtigen Ausrüstung abgefangen werden können. Diese Sicherheitslücke wirft Bedenken hinsichtlich der Privatsphäre der Nutzer auf, da Probe-Anfragen den Standort und das Verhalten der Nutzer offenbaren können.

Bedeutung aktueller Daten

Da sich die Technologie weiterentwickelt, ändert sich auch die Art und Weise, wie Geräte kommunizieren. Die gesammelten Daten zu Probe-Anfragen müssen aktuell sein, um relevant zu bleiben. Durch die Analyse neuerer Daten können Forscher Trends identifizieren und verstehen, wie Geräte unter verschiedenen Bedingungen mit Netzwerken interagieren, zum Beispiel an Werktagen oder am Wochenende.

Erstellung des Datensatzes

Der Datensatz wurde im März 2023 an der Universität Jaume I in Spanien gesammelt. Ein ESP32-Sniffer wurde genutzt, um Probe-Anfragen abzufangen. Dieses Gerät erfasst Rohdaten und speichert sie in einem Format, das mit gängigen Netzwerktools analysiert werden kann. Der Sniffer wurde so eingerichtet, dass er Informationen von verschiedenen Wi-Fi-Kanälen sammelt, um eine umfassende Erfassung der Probe-Anfragen zu gewährleisten.

Büro-Umgebung

Die Erfassung fand in einem offenen Büro mit Massen von etwa 16,71 Metern mal 10,76 Metern statt. In diesem Büro arbeiten normalerweise zwischen 14 und 20 Personen. Die Gestaltung war darauf ausgelegt, die Zusammenarbeit zu fördern, was wichtig ist, um Probe-Anfragen an typischen Arbeitstagen und Feiertagen zu studieren.

Datenbeschreibung

Der Datensatz umfasst Probe-Anfragen, die im Laufe des Monats aufgezeichnet wurden. Ein bemerkenswerter Aspekt ist die Einbeziehung eines lokalen Feiertags, der die Anzahl der Personen im Büro beeinflusst. Der Datensatz zeigt einen konstanten Strom von Probe-Anfragen, selbst nachts, wenn weniger Leute anwesend sind. Diese konstante Aktivität kann auf Geräte zurückgeführt werden, die mit Netzwerken verbunden bleiben oder Anwendungen nutzen, die Internetzugang erfordern.

Analysetrends

Während der Datensammlung wurden mehrere Trends identifiziert. Erstens gab es einen kontinuierlichen Fluss von Probe-Anfragen. Das weist darauf hin, dass Geräte ständig nach Verbindungen suchen. Zweitens gibt es einen deutlichen Höhepunkt der Probe-Anfragen früh am Morgen, wahrscheinlich weil Geräte sich nach einer Inaktivitätsphase wieder verbinden. Ausserdem gab es einen kurzen Zeitraum, in dem keine Anfragen erfasst wurden, was mit einer Zeitumstellung zusammenfiel und zeigt, wie externe Faktoren das Verhalten von Geräten beeinflussen können.

MAC-Adressen und SSIDs

MAC-Adressen sind einzigartige Identifikatoren für Geräte in einem Netzwerk. Zu verstehen, ob Geräte zufällige oder feste MAC-Adressen verwenden, ist entscheidend für die Analyse der Privatsphäre. Geräte, die ihre MAC-Adressen nicht randomisieren, sind leichter zu verfolgen. Der Datensatz erfasste beide Typen, was Einblicke in das Nutzerverhalten gibt. Ein zusätzlicher wichtiger Faktor ist die Bevorzugte Netzwerk Liste (PNL), die die Wi-Fi-Netzwerke enthält, mit denen Geräte häufig verbunden sind. Wenn Geräte Probe-Anfragen für bestimmte Netzwerke senden, können sie unbeabsichtigt ihre PNL teilen, was die Privatsphäre der Nutzer weiter beeinträchtigen kann.

Informationselemente

Probe-Anfragen können zusätzliche Informationen enthalten, die zur Analyse von Geräten nützlich sind. Diese Informationen umfassen die Fähigkeiten der Geräte, wie unterstützte Wi-Fi-Standards und Herstellerdetails. Solche Daten können genutzt werden, um Gerätetypen zu identifizieren und das Nutzerverhalten zu verstehen. Allerdings birgt das auch Privatsphäre-Risiken, da sensible Informationen möglicherweise in diesen Anfragen eingebettet sind.

Radioinformationen

Die gesammelten Daten enthalten empfangene Signalstärkeindikator (RSSI)-Werte, die zeigen, wie stark das Wi-Fi-Signal zum Zeitpunkt jeder Probe-Anfrage ist. RSSI zu verstehen, ist wichtig, um die Verbindungsqualität und die Nutzung des Netzwerk-Umfelds zu analysieren. Der Datensatz zeigte, dass die meisten Probe-Anfragen RSSI-Werte in einem bestimmten Bereich hatten, wobei einige von Geräten in benachbarten Büros kamen. Diese Informationen könnten helfen, die Qualität des Wi-Fi-Umfelds zu bewerten.

Anwendungsfälle für den Datensatz

Es ergeben sich mehrere potenzielle Anwendungen für den Datensatz. Ein Beispiel ist die Bewertung der Wi-Fi-Signalstabilität, die es Forschern ermöglicht, zu untersuchen, wie sich die Signalstärke im Laufe der Zeit verändert. Ein weiterer Anwendungsfall ist die Präsenzdetektion. Durch die Analyse der Aktivitätsmuster von Probe-Anfragen ist es möglich zu bestimmen, wann Personen im Büro anwesend sind. Das kann helfen, die Raumauslastung anhand des Netzwerkverkehrs zu schätzen.

Zudem kann der Datensatz genutzt werden, um die Ausbeutung der Privatsphäre von Nutzern zu analysieren. Indem sie die Daten studieren, können Forscher Schwachstellen in den Management-Protokollen des Netzwerks identifizieren, die potenzielle Risiken im Zusammenhang mit Probe-Anfragen aufzeigen. Schliesslich ermöglicht der Datensatz tiefere Untersuchungen des Verhaltens randomisierter MAC-Adressen und bietet Einblicke in mögliche Tracking-Methoden.

Ethische Überlegungen

Bei der Datensammlung ist es wichtig, die ethischen Implikationen zu berücksichtigen. Das Abfangen von Probe-Anfragen kann unbeabsichtigt sensible Informationen offenbaren. Um dem entgegenzuwirken, wurde der Datensatz durch Hashing-Techniken anonymisiert, sodass originale Identifikatoren nicht direkt mit Personen verknüpft werden können. Dieser Ansatz ermöglicht es Forschern, die Daten zu analysieren, ohne die Privatsphäre der Nutzer zu gefährden.

Fazit

Dieser Artikel stellt einen neuen Datensatz von Probe-Anfragen vor, der aktuelle Wi-Fi-Kommunikationsmuster widerspiegelt. Durch die Bereitstellung aktualisierter Daten verbessert er das Verständnis dafür, wie Geräte mit Netzwerken interagieren, und sensibilisiert für die Privatsphäre-Probleme, die mit unverschlüsselten Anfragen verbunden sind. Forscher können diesen Datensatz nutzen, um verschiedene Anwendungen zu erforschen, darunter Signalstabilität, Präsenzdetektion und Datenschutz. Insgesamt legt diese Arbeit den Grundstein für eine tiefere Erkundung der Wi-Fi-Technologie und des Nutzerverhaltens.

Originalquelle

Titel: UJI Probes: Dataset of Wi-Fi Probe Requests

Zusammenfassung: This paper focuses on the creation of a new, publicly available Wi-Fi probe request dataset. Probe requests belong to the family of management frames used by the 802.11 (Wi-Fi) protocol. As the situation changes year by year, and technology improves probe request studies are necessary to be done on up-to-date data. We provide a month-long probe request capture in an office environment, including work days, weekends, and holidays consisting of over 1 400 000 probe requests. We provide a description of all the important aspects of the dataset. Apart from the raw packet capture we also provide a Radio Map (RM) of the office to ensure the users of the dataset have all the possible information about the environment. To protect privacy, user information in the dataset is anonymized. This anonymization is done in a way that protects the privacy of users while preserving the ability to analyze the dataset to almost the same level as raw data. Furthermore, we showcase several possible use cases for the dataset, like presence detection, temporal Received Signal Strength Indicator (RSSI) stability, and privacy protection evaluation.

Autoren: Tomáš Bravenec, Joaquín Torres-Sospedra, Michael Gould, Tomas Fryza

Letzte Aktualisierung: 2023-12-08 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2308.04435

Quell-PDF: https://arxiv.org/pdf/2308.04435

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel