Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften# Computer und Gesellschaft# Kryptographie und Sicherheit

Die Topics API: Ein neuer Ansatz für die Online-Werbe-Privatsphäre

Die Topics API von Google soll die Privatsphäre der Nutzer bei Werbung verbessern.

― 7 min Lesedauer


Themen-API: DatenschutzThemen-API: Datenschutzin Anzeigenschützen.von Nutzern in der Online-WerbungNeue Methoden sollen die Identitäten
Inhaltsverzeichnis

Web-Tracking durch Cookies von Dritten ist ein grosses Problem für die Privatsphäre der Leute. Viele fordern das Ende dieser Methode, da sie Nutzer ohne ihre klare Zustimmung über verschiedene Websites hinweg verfolgt. Kürzlich hat Google die Topics API eingeführt, eine neue Methode, um Werbung zu schalten, die die Privatsphäre der Nutzer besser respektiert. Dieses System erstellt ein Benutzerprofil basierend auf dem, was der Nutzer online anschaut. Werbetreibende nutzen dann diese Profile, um Anzeigen zu zeigen, die zu den Interessen der Nutzer passen. Es ist jedoch wichtig zu verstehen, wie dieses System funktioniert und wo seine Schwächen liegen.

Verständniss der Topics API

Die Topics API wurde entwickelt, um die alte Methode des Trackings über Cookies zu ersetzen. Anstelle detaillierter persönlicher Informationen wird ein Profil generiert, das die Interessen eines Nutzers basierend auf dessen kürzlichen Online-Aktivitäten zusammenfasst. Jede Woche wählt der Browser Themen aus, für die Besucher von Websites Interesse gezeigt haben, was es weniger invasiv macht als traditionelle Methoden.

Wenn ein Nutzer eine Website besucht, erstellt die Topics API ein Profil möglicher Interessen basierend auf den Arten von Seiten, die der Nutzer häufig besucht hat. Websites können dann eine Version dieses Profils anfordern, die persönliche Informationen nicht auf eine Weise offenlegt, die den Nutzer leicht identifizieren könnte.

Um ein gewisses Mass an Privatsphäre zu wahren, ersetzt die Topics API zufällig einige der Themen durch nicht verwandte. Das bedeutet, dass Werbetreibende zwar eine grobe Vorstellung davon bekommen, was ein Nutzer mögen könnte, aber die Identität des Nutzers nicht mit Sicherheit bestimmen können.

Web-Tracking heute

Im aktuellen Werbemarkt sammeln und analysieren Firmen Daten, um ihre Inhalte zu monetarisieren. Nutzerdaten werden gesammelt, um detaillierte Profile zu erstellen, die die Platzierung von Werbung informieren. Der Prozess verlässt sich normalerweise auf Cookies von Dritten, die Nutzer über mehrere Websites hinweg verfolgen. Wenn ein Nutzer eine Website besucht, fügt ein Tracker ein Cookie zum Browser des Nutzers hinzu. Dieses Cookie enthält eine eindeutige Kennung, die es Trackern ermöglicht, mehrere Besuche einem und demselben Nutzer zuzuordnen.

Diese Methode hat jedoch viel Kritik auf sich gezogen, da sie die Zustimmung der Nutzer vermissen lässt und Missbrauchspotenzial birgt. Einige Browser haben begonnen, die Verwendung von Cookies von Dritten einzuschränken. Infolgedessen suchen viele Unternehmen und Forscher nach Alternativen, die die Privatsphäre der Nutzer respektieren.

Neue Datenschutzmassnahmen

Um von invasiven Tracking-Methoden wegzukommen, werden neue Vorschläge erkundet, die den Nutzern eine grössere Kontrolle über ihre Daten geben. Diese neuen Ansätze versuchen oft, Cookies von Dritten durch Systeme zu ersetzen, die die Informationen der Nutzer schützen, während sie dennoch personalisierte Werbung bereitstellen.

Googles erster Versuch in dieser Richtung hiess Federated Learning of Cohorts (FLoC). In diesem System wurden Nutzer basierend auf gemeinsamen Interessen in Kohorten gruppiert, ohne individuelle Identitäten öffentlich zu machen. Diese Methode wurde jedoch kritisiert, da sie weiterhin potenzielles Tracking über Kohorten im Laufe der Zeit ermöglichte, was schliesslich zu einer individuellen Identifizierung führen könnte.

Mit der Topics API ist der Browser dafür verantwortlich, Benutzerprofile basierend auf dem Browsing-Verhalten zu erstellen, während er strengere Datenschutzmassnahmen einhält. Dieser Ansatz schützt nicht nur die individuellen Identitäten besser, sondern begrenzt auch die mit Werbetreibenden geteilten Daten.

Das Risiko der Re-Identifizierung

Trotz dieser Fortschritte ist die Topics API nicht narrensicher. Forscher haben ihre Verwundbarkeiten bewertet, insbesondere das Potenzial zur Re-Identifizierung. Das bedeutet, dass jemand mit schlechten Absichten die Topics API nutzen könnte, um genügend Informationen zu sammeln, um einen Nutzer über verschiedene Websites hinweg zu identifizieren.

Durch die Verwendung von realen Internet-Verkehrsdaten testeten Forscher, wie ein Angreifer Themen ansammeln könnte. Wenn genügend Themen, für die der Nutzer interessiert ist, über die Zeit gesammelt werden, könnte es möglich sein, dieses Profil mit Nutzern zu vergleichen, die verschiedene Websites besuchen. Dieses Risiko zeigt, dass die Topics API zwar Fortschritte beim Schutz der Privatsphäre macht, die Möglichkeit des Trackings oder der Identifizierung von Nutzern jedoch nicht beseitigt.

Wie funktioniert die Re-Identifizierung?

Um zu verstehen, wie Re-Identifizierung mit der Topics API geschehen könnte, ist es wichtig zu betrachten, wie Benutzerprofile konstruiert werden. Der Browser sammelt Daten über die Websites, die ein Nutzer über die Zeit besucht, und kombiniert diese Informationen in ein Profil von Themen. Wenn ein Angreifer versucht, einen Nutzer zu identifizieren, müsste er die offengelegten Themen sammeln und sie dann mit Profilen von einer anderen Seite abgleichen.

Wenn ein Nutzer eine bestimmte Seite häufig besucht und ein Angreifer seine Themen beobachten kann, kann er versuchen, ein einzigartiges Nutzerprofil zu erstellen. Dadurch könnte der Angreifer feststellen, dass das Profil einzigartige Merkmale hat, die es einfacher machen, den Nutzer in einem anderen Kontext zu identifizieren.

Um zu beurteilen, wie verwundbar ein Benutzerprofil für diesen Angriffstyp ist, ist es notwendig, die Anzahl der Nutzer zu betrachten, die ähnliche Profile haben könnten. Wenn viele Nutzer das gleiche oder ähnliche Profile haben, sinkt das Risiko der Re-Identifizierung, da es schwieriger wäre, eine einzelne Person zu identifizieren.

Die Rolle der Bevölkerungsgrösse in der Anonymität

Die Grösse des Publikums einer Website kann die Wahrscheinlichkeit einer erfolgreichen Re-Identifizierung erheblich beeinflussen. Eine grössere Bevölkerung erhöht die Wahrscheinlichkeit, dass ein Nutzerprofil unter mehreren Personen geteilt wird. Daher verringert sich mit wachsendem Publikum die Chance, einen bestimmten Nutzer zu identifizieren. Das beseitigt jedoch nicht vollständig das Risiko, insbesondere bei Personen mit sehr einzigartigen Interessen.

Zusätzlich, wenn ein Angreifer zusätzliche Informationen verwendet – wie die IP-Adresse eines Nutzers, den Gerätetyp oder andere identifizierende Faktoren – kann er die Gruppe potenzieller Übereinstimmungen eingrenzen. Diese Handlung würde die Chancen eines erfolgreichen Re-Identifizierungsangriffs erhöhen.

Die Risiken mindern

Eine der entscheidenden Funktionen der Topics API ist der zufällige Themenersatz. Indem regelmässig echte Themen durch zufällige ersetzt werden, schafft die API einen Puffer gegen einfache Re-Identifizierung. Die Idee ist, dass wenn viele Themen in einem Nutzerprofil zufällig eingefügt sind, das Profil schwieriger mit einer Person in Einklang zu bringen ist.

Allerdings kann diese Zufälligkeit auch gegen die Nutzer wirken. Die zufälligen Themen können manchmal echte Interessen herausfiltern und es schwierig machen, einzigartige Profile zu identifizieren. Es könnte Bereiche geben, in denen Nutzer nur gelegentlich spezielle Themen besuchen, und diese seltenen Interessen könnten ausgeschlossen werden.

Insgesamt verbessert das Hinzufügen zufälliger Themen zwar die Anonymität bis zu einem gewissen Grad, aber es ist wichtig, ein Gleichgewicht zwischen zu viel Zufälligkeit und dem Bedarf, nützliche Werbeprofile aufrechtzuerhalten, zu finden.

Testen der Topics API

Um zu bewerten, wie effektiv die Topics API bei der Verhinderung von Re-Identifizierung ist, wurden verschiedene Modelle entwickelt, um das Nutzerverhalten zu simulieren. Durch die Untersuchung, wie Nutzer online interagieren und wie ihre Profile gebildet werden, können Forscher besser verstehen, wo die Grenzen des Schutzes der API liegen.

Durch Simulationen haben Forscher herausgefunden, dass die Topics API zwar ein gewisses Mass an Schutz bietet, die Chancen auf eine korrekte Re-Identifizierung dennoch zwischen 15% und 17% liegen können. Das bedeutet, dass es weiterhin ein erhebliches Risiko gibt, dass Nutzer basierend auf den Themen, mit denen sie assoziiert werden, identifiziert werden könnten.

Abschliessende Gedanken

Die Entwicklung der Topics API stellt einen Versuch dar, von invasiven Web-Tracking-Methoden wegzukommen, während dennoch personalisierte Werbung ermöglicht wird. Die Analyse zeigt jedoch, dass das Potenzial zur Re-Identifizierung weiterhin ein Anliegen bleibt, und kontinuierliche Forschung notwendig ist, um bessere Wege zu finden, um Nutzer zu schützen.

Obwohl die Topics API die Identitäten der Nutzer verschleiern kann, garantiert sie keine absolute Anonymität. Die Häufigkeit der Website-Besuche und die Vielfalt der Interessen der Nutzer werden eine entscheidende Rolle dabei spielen, wie verwundbar Personen gegenüber Tracking sind.

Während Werbetreibende und Tech-Unternehmen sich an dieses neue Umfeld anpassen, ist es wichtig, die Effektivität der Topics API zu überwachen und Verbesserungen vorzuschlagen, wo es nötig ist. Neue Methoden müssen ständig erkundet werden, um Datenschutzprobleme zu behandeln, während die Interessen von Werbetreibenden und Nutzern gleichermassen gewahrt bleiben.

Zusammenfassend ist die Topics API zwar ein Schritt in Richtung Nutzerprivatsphäre, aber sie ist nicht narrensicher. Kontinuierliche Anstrengungen sind notwendig, um sicherzustellen, dass Nutzer im Internet surfen können, ohne Angst vor Tracking oder Identifizierung zu haben.

Originalquelle

Titel: On the Robustness of Topics API to a Re-Identification Attack

Zusammenfassung: Web tracking through third-party cookies is considered a threat to users' privacy and is supposed to be abandoned in the near future. Recently, Google proposed the Topics API framework as a privacy-friendly alternative for behavioural advertising. Using this approach, the browser builds a user profile based on navigation history, which advertisers can access. The Topics API has the possibility of becoming the new standard for behavioural advertising, thus it is necessary to fully understand its operation and find possible limitations. This paper evaluates the robustness of the Topics API to a re-identification attack where an attacker reconstructs the user profile by accumulating user's exposed topics over time to later re-identify the same user on a different website. Using real traffic traces and realistic population models, we find that the Topics API mitigates but cannot prevent re-identification to take place, as there is a sizeable chance that a user's profile is unique within a website's audience. Consequently, the probability of correct re-identification can reach 15-17%, considering a pool of 1,000 users. We offer the code and data we use in this work to stimulate further studies and the tuning of the Topic API parameters.

Autoren: Nikhil Jha, Martino Trevisan, Emilio Leonardi, Marco Mellia

Letzte Aktualisierung: 2023-06-08 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2306.05094

Quell-PDF: https://arxiv.org/pdf/2306.05094

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel