Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Computerwissenschaften # Kryptographie und Sicherheit # Maschinelles Lernen

Datenpannen mit STRisk Insights verhindern

Ein neuer Ansatz, um Datenpannen vorherzusagen und zu verhindern, der technische und soziale Daten nutzt.

Hicham Hammouchi, Narjisse Nejjari, Ghita Mezzour, Mounir Ghogho, Houda Benbrahim

― 5 min Lesedauer


STRisk: Vorhersage von STRisk: Vorhersage von Datenpannen Social-Media-Daten analysieren. Risiken durch Technik- und
Inhaltsverzeichnis

Datenlecks sind wie unerwünschte Partygäste. Egal, ob du ein grosses Unternehmen oder ein kleines Startup bist, solche Lecks können alles durcheinanderbringen auf eine Weise, die du dir nie hättest vorstellen können. 2019 gab es tausende von diesen Lecks, die persönliche Informationen wie Süssigkeiten an Halloween verteilen. Diese Sorge ist so gross, dass Unternehmen neue Wege ausprobieren, um vorherzusagen, wann diese Lecks passieren könnten. Ein neuer Ansatz namens STRisk schaut sich sowohl die technischen Dinge als auch das Gerede in den sozialen Medien an, um zu bewerten, welche Unternehmen wahrscheinlich von einem Hackerangriff betroffen sein werden. Klingt fancy, oder? Lass uns das mal aufschlüsseln.

Was ist das Problem?

Wenn Hacker in ein Unternehmen einbrechen, können sie sensible Informationen wie Kreditkartennummern und medizinische Unterlagen stehlen. Sobald diese Informationen draussen sind, können sie im Dark Web landen, wo zwielichtige Gestalten sie gewinnbringend verkaufen. Die durchschnittliche Zeit, die Unternehmen brauchen, um ein Leck zu entdecken, kann erschreckende 206 Tage betragen! Stell dir vor, du wüsstest so lange nicht, dass bei dir eingebrochen wird. Deshalb brauchen Unternehmen einen besseren Weg, um ihr Risiko, gehackt zu werden, einzuschätzen.

Was ist STRisk?

STRisk ist wie ein Superdetektiv für Unternehmen, die Datenlecks vermeiden wollen. Es kombiniert zwei Hauptsachen: die technischen Aspekte zur Sicherheit des Netzwerks eines Unternehmens und was die Leute in den sozialen Medien, hauptsächlich Twitter, über das Unternehmen sagen. Durch die Analyse von Daten aus über 3800 Organisationen versucht STRisk herauszufinden, welche Unternehmen gefährdet sind.

Die Rolle der technischen Daten

Technische Daten sind all das geekige Zeug. Dazu gehört, ob die Website eines Unternehmens offene Ports hat (denk an sie wie an Türen, durch die Hacker schlüpfen können) oder ob ihre Sicherheitszertifikate abgelaufen sind (wie ein Milchkarton, der über das Haltbarkeitsdatum hinaus ist). STRisk wirft einen genauen Blick auf diese Indikatoren, um herauszufinden, wie sicher ein Unternehmen ist. Wenn die technischen Indikatoren eines Unternehmens schwach sind, sollten sie vielleicht ihre Sicherheit verbessern.

Der Soziale Medien-Aspekt

Jetzt kommen wir zum unterhaltsameren Teil: soziale Medien. Unternehmen müssen auch darauf achten, was die Leute online über sie sagen. Wenn das Twitter-Konto eines Unternehmens von negativen Kommentaren überflutet wird, könnte das das Unternehmen zu einem Ziel für Hacker machen. STRisk analysiert Tweets, um die öffentliche Wahrnehmung von Unternehmen zu beurteilen. Das bedeutet, Dinge wie die Anzahl der Leute zu betrachten, die über sie reden, wie viele Likes ihre Posts bekommen, und sogar, wie die Leute zu ihren Tweets stehen. Positive Vibes auf Twitter können ein Schutzschild gegen Hacker sein.

Kräfte bündeln

Durch die Kombination technischer Indikatoren und sozialen Medien-Einblicken kann STRisk ein vollständiges Profil des Risikolevels einer Organisation erstellen. Es ist wie ein Superhelden-Team, bei dem die technischen Daten eine starke Verteidigung bieten und die Social-Media-Insights als Wachposten fungieren und das Unternehmen vor Bedrohungen warnen.

Der Daten-Sammelprozess

Um STRisk effektiv zu nutzen, musste eine Menge Daten gesammelt werden. Das Forschungsteam hat verschiedene Berichte über Datenlecks durchforstet, um eine Liste von betroffenen Organisationen zu erstellen. Sie haben auch Informationen von nicht betroffenen Organisationen gesammelt, die nie ein Leck gemeldet haben. So konnten sie beide Gruppen vergleichen und herausfinden, was sie unterscheidet.

Die Zahlen verstehen

2019 gab es über 7000 gemeldete Datenlecks. Davon waren mehr als 5000 auf Hacking zurückzuführen. Das sind viele Lecks! Die Studie konzentrierte sich darauf, die Merkmale von betroffenen Organisationen im Vergleich zu nicht betroffenen Organisationen zu verstehen. Durch die Analyse der Daten fanden die Forscher spezifische Indikatoren, die vorhersagen konnten, ob eine Organisation wahrscheinlich ein Leck erleiden würde.

Mit "Rauschen" in den Daten umgehen

Ein schwieriger Teil dieser Forschung ist der Umgang mit "Rauschen" in den Daten. Einige Organisationen melden vielleicht keine Datenlecks oder wurden falsch klassifiziert. STRisk verwendet clevere Methoden, um diese falsch etikettierten Organisationen zu identifizieren und zu korrigieren. Dies ist ein wichtiger Schritt, um sicherzustellen, dass die Vorhersagen so genau wie möglich sind.

Maschinenlernmodelle

Um genaue Vorhersagen zu machen, verwendeten die Forscher verschiedene Maschinenlernmodelle. Diese Modelle sind wie smarte Algorithmen, die aus Daten lernen und Muster erkennen können. STRisk verglich die Ergebnisse verschiedener Modelle, um das beste zu finden. In diesem Fall stellte das Team fest, dass die Kombination technischer Daten mit Social-Media-Signalen die Genauigkeit ihrer Vorhersagen erheblich verbesserte.

Ergebnisse, die herausstechen

Die Ergebnisse von STRisk sind beeindruckend. Durch die Nutzung sowohl technischer als auch sozialer Mediendaten hat das Modell eine Vorhersagegenauigkeit von über 98 % erreicht. Das ist eine deutliche Verbesserung im Vergleich zur Verwendung nur technischer Merkmale, was zeigt, dass soziale Einblicke entscheidend sind. Es ist wie der Blick in den Rückspiegel, bevor man die Spur wechselt; manchmal muss man über den Tacho hinaus schauen.

Was kommt als Nächstes?

Obwohl STRisk vielversprechende Ergebnisse geliefert hat, gibt es immer Raum für Verbesserungen. Künftige Forschungen könnten sich mit mehr technischen Daten aus den Organisationen, Einsichten aus Diskussionen im Dark Web und sogar dem Geld, das eine Organisation für Sicherheit ausgibt, befassen. Es gibt eine ganze Welt von Informationen, die STRisk noch besser machen könnten.

Einschränkungen der aktuellen Studie

Jeder Superheld hat Einschränkungen, und STRisk ist da keine Ausnahme. Die Forschung konzentrierte sich hauptsächlich auf Datenlecks, die durch Hacking verursacht wurden, aber es gibt auch andere Arten von Lecks. Die Erweiterung der Forschung auf alle Arten von Lecks könnte eine umfassendere Risikobewertung bieten.

Fazit

In einer Welt, in der Datenlecks immer häufiger werden, hebt sich STRisk als leistungsstarkes Werkzeug für Organisationen hervor. Durch die Betrachtung sowohl technischer als auch sozialer Faktoren können Unternehmen ihr Risiko einer Exposition gegenüber Hackerangriffen besser einschätzen. Diese Forschung zeigt eine klare Verbindung zwischen dem sozialen Ruf eines Unternehmens und dessen Sicherheitslage. Kurz gesagt, wenn eine Organisation vermeiden will, Opfer eines Hackerangriffs zu werden, sollte sie ihre Twitter-Erwähnungen genauso genau im Auge behalten wie ihre Sicherheitssysteme.

Originalquelle

Titel: STRisk: A Socio-Technical Approach to Assess Hacking Breaches Risk

Zusammenfassung: Data breaches have begun to take on new dimensions and their prediction is becoming of great importance to organizations. Prior work has addressed this issue mainly from a technical perspective and neglected other interfering aspects such as the social media dimension. To fill this gap, we propose STRisk which is a predictive system where we expand the scope of the prediction task by bringing into play the social media dimension. We study over 3800 US organizations including both victim and non-victim organizations. For each organization, we design a profile composed of a variety of externally measured technical indicators and social factors. In addition, to account for unreported incidents, we consider the non-victim sample to be noisy and propose a noise correction approach to correct mislabeled organizations. We then build several machine learning models to predict whether an organization is exposed to experience a hacking breach. By exploiting both technical and social features, we achieve a Area Under Curve (AUC) score exceeding 98%, which is 12% higher than the AUC achieved using only technical features. Furthermore, our feature importance analysis reveals that open ports and expired certificates are the best technical predictors, while spreadability and agreeability are the best social predictors.

Autoren: Hicham Hammouchi, Narjisse Nejjari, Ghita Mezzour, Mounir Ghogho, Houda Benbrahim

Letzte Aktualisierung: 2024-11-19 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2411.12435

Quell-PDF: https://arxiv.org/pdf/2411.12435

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel