Die Datenbroker-Branche: Ein Blick auf die Datenschutzrichtlinien
Die Überprüfung von Datenschutzrichtlinien zeigt Trends in der Datensammlung und im Verbraucherschutz.
― 6 min Lesedauer
Inhaltsverzeichnis
Das Sammeln von persönlichen Informationen von Einzelpersonen ist heutzutage ein grosses Geschäft. Unternehmen, die als Datenmakler und -verarbeiter bekannt sind, kaufen, verkaufen und sammeln diese Informationen und verwandeln sie in eine Milliarden-Dollar-Industrie. Allerdings gibt es ein grosses Problem: Es fehlt oft an Transparenz. Das macht es für die Leute schwer zu wissen, welche Daten über sie gesammelt werden, wie sie genutzt werden und welche Risiken sie eingehen.
In dieser Studie werfen wir einen genauen Blick auf Datenschutzerklärungen von 1997 bis 2019, um mehr darüber zu erfahren, was Datenmakler und -verarbeiter mit den persönlichen Informationen anstellen, die sie sammeln. Wir erstellen auch eine Liste von Begriffen, die mit persönlichen Informationen in Verbindung stehen, basierend auf Gesetzen, die Verbraucher schützen. Durch die Analyse von Datenschutzerklärungen im Laufe der Zeit versuchen wir herauszufinden, wie sich diese Richtlinien verändert haben und inwieweit sie die persönlichen Informationen der Menschen schützen.
Die Datenmakler-Industrie
Datenmakler und -verarbeiter agieren in einem grossen Markt, der persönliche Daten sammelt und verkauft. Laut Forschung hat die Branche 2020 etwa 300 Milliarden Dollar generiert und wird in den kommenden Jahren voraussichtlich schnell wachsen. Trotz neuer Gesetze in den USA und Europa zur Regulierung dieser Branche bleiben Datenmakler oft in ihren Abläufen undurchsichtig und geben nicht klar an, welche Daten sie sammeln und wie sie diese nutzen.
Viele Unternehmen, die Daten verarbeiten, werden vielleicht nicht einmal als Datenmakler gekennzeichnet, selbst wenn sie Informationen zum Gewinn verarbeiten und teilen. Das sorgt für Verwirrung bei den Verbrauchern, die sich möglicherweise nicht darüber im Klaren sind, wer Zugang zu ihren persönlichen Daten hat.
Transparenzprobleme
Eines der Hauptprobleme in der Datenmakler-Industrie ist der Mangel an Transparenz. Das macht es schwierig, die potenziellen Schäden, die aus dem Sammeln persönlicher Daten entstehen, zu identifizieren. Es gibt mehrere wichtige Probleme:
- Unklare Datensammlung: Die Leute wissen nicht, wie viele Daten gesammelt wurden oder welche Arten von Daten betroffen sind.
- Finanzberichterstattung: Viele Datenmakler sind nicht verpflichtet, ihre Einnahmen zu melden, was es schwer macht, den Marktwert der Daten, die sie verwalten, zu verstehen.
- Zugriffstracking: Verbraucher können oft nicht nachverfolgen, wer Zugang zu ihren persönlichen Daten erhalten hat.
Datenmakler argumentieren normalerweise, dass sie Informationen mit Zustimmung der Einzelpersonen sammeln. Allerdings stellen sich Fragen, ob diese Zustimmung wirklich informiert ist, angesichts der Komplexität der Datenschutzerklärungen und der Informationen, die benötigt werden, um sie vollständig zu verstehen.
Forschungsfokus
Diese Studie zielt darauf ab, mehrere Forschungsfragen zu den Arten von persönlichen Informationen zu beantworten, die von Datenmaklern gesammelt werden, und wie sich die Datenschutzerklärungen im Laufe der Zeit verändert haben. Unser Ansatz umfasst die Untersuchung von Texten der Datenschutzerklärungen, die Identifizierung relevanter Begriffe und die Analyse von Trends in der Sprache, die in diesen Richtlinien verwendet wird.
Forschungsfragen
- Welche Wörter und Themen im Zusammenhang mit persönlichen Informationen erscheinen im Laufe der Zeit in Datenschutzerklärungen?
- Welche Arten von persönlichen Informationen werden gesammelt und wie konsistent ist diese Information über die Zeit?
- Wie komplex sind Datenschutzerklärungen, und wie hat sich diese Komplexität verändert?
- Wie sensibel sind die Arten von persönlichen Informationen, die gesammelt werden, und wie hat sich diese Sensibilität im Laufe der Zeit verändert?
Methodologie
Um diese Fragen zu beantworten, sammeln wir ein grosses Datenset von Datenschutzerklärungen aus dem Internet Archive, das über 20 Jahre umfasst. Dieses Datenset enthält über eine Million Schnappschüsse von Datenschutzerklärungen, was uns eine gründliche Analyse ermöglicht.
Datenbereinigung und -analyse
Wir bereinigen und segmentieren das Datenset, indem wir unnötige Elemente wie Negationen entfernen und den Text tokenisieren. Wir filtern die Dokumente, um uns auf Begriffe zu konzentrieren, die mit persönlichen Informationen zusammenhängen, und erstellen ein spezifisches Lexikon basierend auf rechtlichen Definitionen aus verschiedenen Bundesstaaten.
Analysebereiche
Wir analysieren die Daten auf drei Ebenen: Wortebene, Themenebene und Netzwerkebene.
- Wortanalyse: Wir betrachten die Häufigkeit spezifischer Wörter im Zusammenhang mit persönlichen Informationen über die Zeit und notieren Anstiege, Rückgänge und stabile Begriffe.
- Themenanalyse: Wir messen die Komplexität der Datenschutzerklärungen und verfolgen die Verbreitung von Themen, die mit persönlichen Informationen zusammenhängen.
- Netzwerkanalyse: Wir untersuchen die gemeinsame Verwendung von Begriffen in Datenschutzerklärungen, um zu verstehen, wie verschiedene Arten von persönlichen Informationen miteinander verbunden sind.
Ergebnisse
Einblicke auf Wortebene
Durch die Untersuchung der Häufigkeit von Begriffen zu persönlichen Informationen stellen wir fest, dass es eine Mischung aus steigenden, fallenden und stabilen Begriffen über die Zeit gibt:
- Steigende Begriffe: Wir bemerken, dass Begriffe, die sich auf sensible Daten beziehen, wie Geolocation, Verhaltensdaten und Schlussfolgerungen, erheblich zugenommen haben.
- Fallende Begriffe: Einige ältere Wörter, die mit persönlichen Daten zu tun haben, sind zurückgegangen, wahrscheinlich weil neuere Begriffe aufgetaucht sind, die technologische Veränderungen widerspiegeln.
- Stabile Begriffe: Bestimmte Identifikatoren, wie "Adresse" und "Alter", sind über die Jahre hinweg konstant in Datenschutzerklärungen vorhanden.
Einblicke auf Themenebene
Durch Themenmodellierung stellen wir fest, dass die Komplexität der Datenschutzerklärungen im Laufe der Zeit abgenommen hat, was auf einen Trend zu standardisierterer Sprache hinweist. Bestimmte Themen, wie die Verwendung von Cookies, bleiben vorherrschend, während andere, wie manuelle Identifikatoren wie Namen, weniger gebräuchlich geworden sind.
Einblicke auf Netzwerkanalyse
Wenn wir die gemeinsame Verwendung von Begriffen zu persönlichen Informationen analysieren, sehen wir, dass die Dichte des Netzwerks zugenommen hat. Dies deutet auf ein besseres Verständnis der verschiedenen Arten von persönlichen Daten hin, was möglicherweise eine höhere Sensibilität und Risiko für die betroffenen Personen impliziert.
Diskussion
Die Analyse zeigt mehrere wichtige Trends in den Datenschutzerklärungen und der Datenmakler-Industrie:
- Gesetzgebungskorrelation: Veränderungen in den Datenschutzgesetzen scheinen die Stabilität und Muster in den Datenschutzerklärungen zu beeinflussen. Neue Gesetze führen oft zu Aktualisierungen, wie Begriffe verwendet werden.
- Komplexitätsreduktion: Datenschutzerklärungen werden regelmässiger und leichter verständlich, wahrscheinlich aufgrund des regulatorischen Drucks.
- Zunehmende Sensibilität: Es gibt ein wachsendes Bewusstsein für die Sensibilität, die mit persönlichen Daten verbunden ist. Begriffe, die sich auf Gesundheit und Geolocation beziehen, sind häufiger geworden und verdeutlichen die breiteren Auswirkungen der Datensammlung.
Zukünftige Richtungen
Diese Studie hebt die Notwendigkeit für mehr Forschung in der Datenmakler-Industrie und bei Datenschutzerklärungen hervor. Künftige Arbeiten könnten eine detaillierte Untersuchung darüber umfassen, wie verschiedene Datentypen gesammelt und geteilt werden, sowie die potenziellen rechtlichen Konsequenzen von Datenmissbrauch.
Fazit
Das Sammeln und Verkaufen persönlicher Informationen ist eine weit verbreitete Praxis, die Risiken für Einzelpersonen mit sich bringt. Der Mangel an Transparenz und Verantwortung in der Datenmakler-Industrie erschwert die Bemühungen, Verbraucher zu schützen. Diese Studie bietet Einblicke in die Veränderungen von Datenschutzerklärungen im Laufe der Zeit und in die Arten von persönlichen Daten, die zunehmend gesammelt werden, und hilft, dieses kritische Thema zu beleuchten.
Es ist mehr Arbeit nötig, um zu verstehen, wie Persönliche Informationen fliessen und um bessere Rahmenbedingungen zum Schutz der Verbraucherdaten in einer sich ständig verändernden Landschaft zu entwickeln. Wir hoffen, dass diese Analyse einen Schritt in Richtung grösserer Awareness und Verantwortlichkeit in der Datenmakler-Industrie darstellt.
Titel: More Data Types More Problems: A Temporal Analysis of Complexity, Stability, and Sensitivity in Privacy Policies
Zusammenfassung: Collecting personally identifiable information (PII) on data subjects has become big business. Data brokers and data processors are part of a multi-billion-dollar industry that profits from collecting, buying, and selling consumer data. Yet there is little transparency in the data collection industry which makes it difficult to understand what types of data are being collected, used, and sold, and thus the risk to individual data subjects. In this study, we examine a large textual dataset of privacy policies from 1997-2019 in order to investigate the data collection activities of data brokers and data processors. We also develop an original lexicon of PII-related terms representing PII data types curated from legislative texts. This mesoscale analysis looks at privacy policies overtime on the word, topic, and network levels to understand the stability, complexity, and sensitivity of privacy policies over time. We find that (1) privacy legislation correlates with changes in stability and turbulence of PII data types in privacy policies; (2) the complexity of privacy policies decreases over time and becomes more regularized; (3) sensitivity rises over time and shows spikes that are correlated with events when new privacy legislation is introduced.
Autoren: Juniper Lovato, Philip Mueller, Parisa Suchdev, Peter S. Dodds
Letzte Aktualisierung: 2023-02-17 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2302.08936
Quell-PDF: https://arxiv.org/pdf/2302.08936
Lizenz: https://creativecommons.org/licenses/by/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.