Ein umfassender Blick auf Bitcoin-Transaktionen
Eine neue Datensammlung von Bitcoin-Transaktionen erkunden, um tiefere Einblicke zu bekommen.
Hugo Schnoering, Michalis Vazirgiannis
― 8 min Lesedauer
Inhaltsverzeichnis
- Das grosse Ganze
- Der Datensatz
- Der Graph erklärt
- Die überwachten Aufgaben
- Warum ist Bitcoin besonders?
- Das Transaktionsspiel
- Den Graphen aufbauen
- Knoten definieren
- Kanten zeichnen
- Eindeutige Merkmale des Datensatzes
- Verschiedene Arten von Entitäten
- BitcoinTalk – Unser Schatz
- Alles zusammenfügen
- Datenvalidierung
- Ein schneller Blick auf Anwendungsfälle
- Den Datensatz bekommen
- Zusammenfassung
- Originalquelle
- Referenz Links
Bitcoin hat 2008 angefangen, erstellt von jemandem, der sich Satoshi Nakamoto nennt. Es war der erste echte Versuch einer digitalen Währung, die keine Bank oder Regierung braucht, um den Überblick zu behalten. Stattdessen konnten die Leute direkt untereinander Werte tauschen. Dieses Papier spricht über einen riesigen Datensatz, der sich alle Transaktionen mit Bitcoin anschaut, dargestellt als Graph. Was heisst das? Denk daran wie an eine grosse Karte, die zeigt, wer wem Geld schickt.
Das grosse Ganze
Also, bei Bitcoin geht es darum, eine neue Art von Wirtschaft zu schaffen. In dieser Wirtschaft kannst du dein Geld behalten und es jemandem anders schicken, ohne eine Bank zu brauchen. Bitcoin funktioniert nach einem Regelwerk, dem alle zustimmen. Im Gegensatz zu herkömmlichem Geld gibt es keine zentrale Instanz, die die Inflation verwaltet oder Transaktionen überprüft. Stattdessen nutzt Bitcoin ein Netzwerk von Nutzern, die zusammenarbeiten, um sicherzustellen, dass alles reibungslos läuft.
Seit Bitcoin ins Leben gerufen wurde, benutzen immer mehr Leute es. Bis 2023 sind etwa 270.000 Nutzer jeden Tag auf den Bitcoin-Zug aufgesprungen und haben unglaubliche 8,6 Billionen Dollar bewegt. Das ist eine Menge Pizza! Auch Forscher haben ein grosses Interesse an Bitcoin, und jedes Jahr tauchen Tausende von Studien auf, die Antworten und Einblicke in dieses digitale Wunderland suchen.
Der Datensatz
Trotz all der öffentlichen Daten zu Bitcoin-Transaktionen ist es wie die Suche nach der Nadel im Heuhaufen, einen soliden Datensatz für die Forschung zu finden. Viele Leute haben sich darauf konzentriert, Bitcoin sicherer und nützlicher zu machen, aber es gibt immer noch eine Menge Herausforderungen, wie Betrug und andere fiese Verhaltensweisen.
Dieses Papier stellt einen grossen Datensatz vor, der Bitcoin-Transaktionen abbildet. Dieser Datensatz ist nicht nur ein paar mickrige Transaktionen – er umfasst über 252 Millionen Knoten und 785 Millionen Kanten, also Verbindungen, über fast 13 Jahre! Dieser Datensatz ist wichtig, weil es der grösste öffentlich verfügbare Datensatz zu Bitcoin-Transaktionsdaten ist, was das Leben für Forscher einfacher macht.
Der Graph erklärt
In diesem Graph stellt jeder Knoten einen identifizierbaren Nutzer, eine Organisation oder eine Institution dar, die an Bitcoin beteiligt ist, wie echte Leute oder Firmen. Die Kanten zeigen den Geldfluss zwischen diesen Knoten. Gute Nachricht: Alles in diesem Datensatz ist mit Zeitstempeln versehen, sodass Forscher den Zeitverlauf der Transaktionen sehen können, was es einfacher macht, Muster über die Zeit zu studieren.
Die überwachten Aufgaben
Um die Analyse einfacher zu machen, haben die Forscher zwei beschriftete Sätze eingerichtet:
- Einen mit 33.000 Knoten, basierend darauf, welche Art von Entitäten sie sind (wie Personen oder Firmen).
- Einen anderen mit fast 100.000 Bitcoin-Adressen, die so getaggt sind, dass jeder weiss, zu wem sie gehören.
Dieser Datensatz ist grösser und besser als frühere. Um die Sache noch spannender zu machen, haben die Forscher verschiedene Modelle trainiert, um die Knotenbeschriftungen vorherzusagen, sodass sie eine Basis für zukünftige Forschungen festlegen können. Denk daran wie an eine Karte für Forscher, während sie durch einen digitalen Dschungel wandern.
Warum ist Bitcoin besonders?
Bitcoin unterscheidet sich in einem grossen Punkt von normalen Währungen. Es nutzt etwas, das asymmetrische Kryptografie heisst, wobei jeder Nutzer einen privaten Schlüssel hat, um seine Gelder sicher zu halten. Dieser Schlüssel wird niemals mit jemandem geteilt. Stattdessen interagieren die Leute über Adressen, die mit ihren privaten Schlüsseln verknüpft sind.
Jeder Bitcoin wird in etwas gespeichert, das Transaktionsausgabe (TXO) genannt wird. Eine TXO hat einen Wert und ein Locking-Skript, das uns sagt, wie wir es nutzen können. Richtig, du kannst nicht einfach reingehen und es nehmen; du musst die Regeln befolgen!
Das Transaktionsspiel
Wenn du eine Transaktion machst, nimmst du einige TXOs, gibst sie aus und erstellst neue. Wenn der Betrag, den du ausgibst, kleiner oder gleich dem Betrag ist, den du zurückbekommst, ist alles gut. In diesem Spiel geht die TXO von ungenutzt zu genutzt, bereit für den zukünftigen Einsatz.
Die meisten Leute denken bei Bitcoin-Transaktionen daran, Geld herumzubewegen. In Wirklichkeit geht es darum, TXOs von einem Ort zum anderen zu verschieben und dabei ein bisschen was durcheinanderzubringen, während alles legitim bleibt.
Den Graphen aufbauen
Beim Aufbau dieses grossen Datensatzes mussten die Forscher Daten von der Bitcoin-Blockchain abrufen, die wie ein öffentliches Hauptbuch ist, in dem alle Transaktionen aufgezeichnet werden. Die Forscher haben einen speziellen Bitcoin-Knoten installiert, alle Transaktionsdaten heruntergeladen und angefangen, sie durchzugehen.
Knoten definieren
All das Bitcoin da draussen ist in ungenutzten TXOs gesperrt, und dort hatte das Forscherteam die Idee für Knoten. Sie schauten sich die Locking-Skripte an, die die Gelder sichern, und nutzten das als Basis, um die echten Entitäten hinter jedem Knoten zu identifizieren.
Mit ein paar cleveren Tricks aus vorheriger Forschung stellten die Forscher Verbindungen zwischen Skripten her und identifizierten, wer hinter dem Geld steckt. Am Ende fanden sie mehr als 874 Millionen Skripte, die sie in Cluster gruppierten, die reale Nutzer repräsentieren.
Kanten zeichnen
Jetzt, wenn es darum geht, Verbindungen – oder Kanten – zwischen Knoten zu definieren, da fängt der richtige Spass an. Wenn Nutzer Geld senden und empfangen, müssen die Forscher verstehen, wer sendet und wer empfängt.
Wenn ein Knoten (der Sender) Wert an einen anderen Knoten (den Empfänger) sendet, erstellen sie eine Kante, die diese Transaktion zeigt. Es gibt ein paar spezielle Transaktionen, auf die man achten sollte, wie CoinJoin-Transaktionen, die Geld von verschiedenen Nutzern mischen, um es privat zu halten. Die sind ein bisschen tricky, also haben die Forscher beschlossen, sie beim Aufbau ihres Datensatzes aussen vor zu lassen.
Eindeutige Merkmale des Datensatzes
Der Datensatz ist nicht nur ein grosser Haufen Zahlen; er hat einige coole Features. Jede Kante im Graph trägt Informationen über die Transaktionen, während jeder Knoten Einblicke in das Verhalten der verbundenen Entitäten gibt.
Verschiedene Arten von Entitäten
Das Bitcoin-Ökosystem ist voll von Akteuren mit unterschiedlichen Rollen. Das können normale Leute, Unternehmen oder sogar zwielichtige Betreiber sein. Es wird viel geforscht, um zu verstehen, wie diese Akteure mit Bitcoin interagieren.
Um diese Entitäten zu kennzeichnen, verwendeten die Forscher Informationen aus verschiedenen Quellen, einschliesslich Foren und Datenbanken. Sie bearbeiteten eine Reihe von Entitätstypen: von Minern, die Transaktionen bestätigen, bis zu Börsen, an denen Leute Bitcoin handeln. Jede Entität bekommt ein kleines Label, sodass es einfach ist zu wissen, was sie so machen.
BitcoinTalk – Unser Schatz
Um diese Labels zu finden, schauten sich die Forscher BitcoinTalk an, ein Forum, das mit Bitcoin-Diskussionen voll ist. Sie durchwühlten die Beiträge und zogen Informationen über Adressen, Kontext und Aktivitäten im Zusammenhang mit Bitcoin-Transaktionen heraus.
Durch das Durchsuchen dieses Forums sammelten sie beeindruckende 14 Millionen Nachrichten. Das ist eine Menge Geplänkel! Mit cleverer KI reinigten sie die Daten, stellten Verbindungen her und vergaben Labels für die Adressen.
Alles zusammenfügen
Sobald der Graph aufgebaut war, trainierten die Forscher mehrere Modelle, um vorherzusagen, was jeder Knoten basierend auf seinen Verbindungen und Merkmalen repräsentiert. Damit testeten sie, wie gut der Datensatz helfen kann, zwischen verschiedenen Nutzertypen zu unterscheiden.
Datenvalidierung
Um sicherzustellen, dass alles korrekt war, schauten sich die Forscher an, wie gut sie Labels basierend auf den Merkmalen vorhersagen konnten. Das dient als eine Möglichkeit, den Datensatz zu validieren, indem man sieht, ob er off-chain-Daten (wie Internetdiskussionen) mit den on-chain-Daten (tatsächlichen Transaktionen) verbinden kann.
Ein schneller Blick auf Anwendungsfälle
Dieser Datensatz ist kein Ein-Trick-Pony. Neben der Vorhersage von Labels gibt es viele andere Möglichkeiten, ihn zu nutzen:
-
Interaktionsmuster beobachten: Indem man studiert, wie verschiedene Entitätstypen über die Zeit interagieren, können Forscher sehen, wie sich diese Beziehungen verändern. Das schliesst Dinge wie Geldwäsche und zwielichtige Machenschaften ein.
-
Änderungen über die Zeit beobachten: Einen Blick darauf zu werfen, wie sich der Bitcoin-Graph entwickelt, kann viel über das Wachstum und die Trends des Netzwerks über die Zeit erzählen.
-
Netzwerke vergleichen: Forscher können Bitcoin mit anderen Wirtschaftsnetzwerken vergleichen, um die einzigartigen Merkmale besser zu verstehen.
Den Datensatz bekommen
Der Datensatz ist für jeden verfügbar, der eintauchen möchte. Er enthält eine Schatztruhe von Informationen, einschliesslich Nachrichten von BitcoinTalk, beschrifteten Adressen und dem gesamten Graphen, der in einer Datenbank gespeichert ist.
Zusammenfassung
Also, da hast du es. Dieser neuartige Datensatz ist wie eine Karte, die neue Wege für die Forschung zu Bitcoin-Transaktionen eröffnet. Er hilft Forschern, die Verbindungen zwischen Nutzern zu erkennen, was das Studium davon, wie Werte durch diese digitale Währung fliessen, einfacher macht.
Egal, ob du ein Forscher bist, der seinen Entdeckerhut aufsetzen möchte, oder einfach nur jemand, der neugierig ist, wie Bitcoin funktioniert, dieser Datensatz ist eine spannende Gelegenheit, mehr zu lernen. Wer weiss? Vielleicht entdeckst du etwas Bahnbrechendes, das alle anderen übersehen haben!
Titel: Bitcoin Research with a Transaction Graph Dataset
Zusammenfassung: Bitcoin, launched in 2008 by Satoshi Nakamoto, established a new digital economy where value can be stored and transferred in a fully decentralized manner - alleviating the need for a central authority. This paper introduces a large scale dataset in the form of a transactions graph representing transactions between Bitcoin users along with a set of tasks and baselines. The graph includes 252 million nodes and 785 million edges, covering a time span of nearly 13 years of and 670 million transactions. Each node and edge is timestamped. As for supervised tasks we provide two labeled sets i. a 33,000 nodes based on entity type and ii. nearly 100,000 Bitcoin addresses labeled with an entity name and an entity type. This is the largest publicly available data set of bitcoin transactions designed to facilitate advanced research and exploration in this domain, overcoming the limitations of existing datasets. Various graph neural network models are trained to predict node labels, establishing a baseline for future research. In addition, several use cases are presented to demonstrate the dataset's applicability beyond Bitcoin analysis. Finally, all data and source code is made publicly available to enable reproducibility of the results.
Autoren: Hugo Schnoering, Michalis Vazirgiannis
Letzte Aktualisierung: 2024-11-15 00:00:00
Sprache: English
Quell-URL: https://arxiv.org/abs/2411.10325
Quell-PDF: https://arxiv.org/pdf/2411.10325
Lizenz: https://creativecommons.org/licenses/by-sa/4.0/
Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.
Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.
Referenz Links
- https://bitcointalk.org/
- https://coinmarketcap.com
- https://figshare.com/articles/dataset/BitcoinTemporalGraph/26305093
- https://doi.org/10.6084/m9.figshare.26305093.v1
- https://github.com/hugoschnoering2/BTCGraphConstruction
- https://github.com/hugoschnoering2/BTCGraphLabeling
- https://github.com/hugoschnoering2/BTCGraphPredictingLabel