Simple Science

Scienza all'avanguardia spiegata semplicemente

# Finanza quantitativa # Apprendimento automatico # Finanza generale

Uno sguardo completo alle transazioni di Bitcoin

Esplorando un nuovo set di dati sulle transazioni di Bitcoin per capire meglio.

Hugo Schnoering, Michalis Vazirgiannis

― 8 leggere min


Analizzando il dataset Analizzando il dataset delle transazioni di Bitcoin delle transazioni di Bitcoin. Un'immersione profonda nei vasti dati
Indice

Bitcoin è iniziato nel 2008, creato da qualcuno che si fa chiamare Satoshi Nakamoto. È stato il primo vero tentativo di una valuta digitale che non ha bisogno di una banca o di un governo per tenere traccia delle cose. Invece, ha permesso alle persone di scambiare valore direttamente tra loro. Questo documento parla di un enorme Set di dati che analizza tutte le transazioni fatte con Bitcoin, rappresentato come un grafo. Allora, cosa significa? Beh, pensalo come una grande mappa che mostra chi sta mandando soldi a chi.

Il Grande Quadro

Quindi, Bitcoin riguarda la creazione di un nuovo tipo di economia. In questa economia, puoi tenere i tuoi soldi e mandarli a qualcun altro senza bisogno di una banca per farlo. Bitcoin funziona su un insieme di regole su cui tutti sono d'accordo. A differenza del denaro tradizionale, non c'è un'autorità centrale che gestisce l'inflazione o verifica le transazioni. Invece, Bitcoin usa una rete di utenti che lavorano insieme per assicurarsi che tutto funzioni senza intoppi.

Da quando Bitcoin è nato, sempre più persone hanno iniziato a usarlo. Nel 2023, circa 270.000 utenti saltavano a bordo del treno Bitcoin ogni giorno, muovendo un incredibile $8.6 trilioni. Sono un sacco di pizze! Anche i ricercatori hanno mostrato un forte interesse per Bitcoin, con migliaia di studi che spuntano ogni anno in cerca di risposte e intuizioni in questo meraviglioso mondo digitale.

Il Dataset

Nonostante tutti i dati pubblici disponibili sulle transazioni Bitcoin, trovare un buon set di dati per la ricerca è come cercare un ago in un pagliaio. Molti si sono concentrati nel rendere Bitcoin più sicuro e utile, ma ci sono ancora un bel po' di sfide, come frodi e altri comportamenti loschi.

Questo documento introduce un ampio set di dati che mappa le transazioni Bitcoin. Questo dataset non è solo qualche misera transazione: include oltre 252 milioni di Nodi e 785 milioni di collegamenti, o edge, per quasi 13 anni! Questo dataset è una grande cosa perché è il più grande set di dati di transazioni Bitcoin disponibile pubblicamente, rendendo la vita più facile per i ricercatori.

Il Grafo Spiegato

In questo grafo, ogni nodo rappresenta un utente, un'organizzazione o un'istituzione identificabile coinvolta in Bitcoin, come persone reali o aziende. Gli edges rappresentano il flusso di denaro tra questi nodi. Buone notizie: tutto in questo dataset è timestampato, quindi i ricercatori possono vedere la cronologia delle transazioni, facilitando lo studio dei modelli nel tempo.

I Compiti Supervisionati

Per rendere l'analisi più fluida, i ricercatori hanno impostato due set etichettati:

  1. Uno con 33.000 nodi basato sul tipo di entità (come persone o aziende).
  2. Un altro con quasi 100.000 indirizzi Bitcoin etichettati così tutti sanno a chi appartengono.

Questo dataset è più grande e migliore rispetto ai precedenti. Per rendere le cose ancora più eccitanti, i ricercatori hanno addestrato diversi modelli per prevedere le etichette dei nodi, in modo da stabilire una base per la ricerca futura. Pensalo come dare ai ricercatori una mappa mentre vagano in una giungla digitale.

Perché Bitcoin è Speciale?

Bitcoin è diverso dalle valute normali in un modo importante. Usa qualcosa chiamato crittografia asimmetrica, dove ogni utente ha una chiave privata per tenere al sicuro i propri fondi. Questa chiave non viene mai condivisa con nessuno. Invece, le persone interagiscono usando indirizzi collegati alle loro chiavi private.

Ogni Bitcoin è salvato in qualcosa chiamato Output di Transazione (TXO). Un TXO ha un valore e uno script di blocco che ci dice come usarlo. Esatto, non puoi semplicemente entrare e prenderlo; devi seguire le regole!

Il Gioco delle Transazioni

Quando fai una transazione, prendi alcuni TXO, li spendi e ne crei di nuovi. Se l'importo che spendi è minore o uguale all'importo che ricevi, tutto è a posto. In questo gioco, il TXO passa da non speso a speso, pronto per un futuro utilizzo.

La maggior parte delle persone pensa alle transazioni Bitcoin come a spostare soldi. In realtà, si tratta di cambiare i TXO da un posto all'altro, scuotendo un po' le cose mantenendo tutto legittimo.

Costruire il Grafo

Quando hanno impostato questo enorme dataset, i ricercatori hanno dovuto estrarre dati dalla blockchain di Bitcoin, che è come un registro pubblico dove sono registrate tutte le transazioni. I ricercatori hanno installato un nodo speciale di Bitcoin, scaricato tutti i dati sulle transazioni e hanno iniziato a esaminarli.

Definire i Nodi

Tutti i Bitcoin là fuori sono bloccati in TXO non spesi, ed è da qui che i ricercatori hanno preso l'idea per i nodi. Hanno dato un'occhiata agli script di blocco che tengono i fondi al sicuro e li hanno usati come base per identificare le vere entità dietro ogni nodo.

Usando alcuni trucchi intelligenti da ricerche precedenti, i ricercatori hanno creato collegamenti tra gli script e hanno identificato chi era dietro il denaro. Alla fine, hanno scoperto più di 874 milioni di script, che hanno raggruppato in cluster che rappresentano utenti reali.

Disegnare gli Edges

Ora, quando si tratta di definire le connessioni – o edges – tra i nodi, è lì che inizia il vero divertimento. Quando gli utenti inviano e ricevono denaro, i ricercatori devono capire chi sta inviando e chi sta ricevendo.

Se un nodo (il mittente) invia valore a un altro nodo (il destinatario), creano un edge che mostra questa transazione. Ci sono un paio di transazioni speciali da tenere d'occhio, come le transazioni CoinJoin, che mescolano denaro da diversi utenti per mantenerlo privato. Queste sono un po' complicate, quindi i ricercatori hanno deciso di escluderle quando hanno costruito il loro dataset.

Caratteristiche Uniche del Dataset

Il dataset non è solo un grande mucchio di numeri; viene fornito con alcune caratteristiche interessanti. Ogni edge nel grafo porta informazioni sulle transazioni, mentre ogni nodo condivide intuizioni sul comportamento delle entità collegate.

Diversi Tipi di Entità

L'ecosistema di Bitcoin è pieno di attori con ruoli diversi. Questi possono essere persone comuni, aziende o persino operatori loschi. Si sta facendo un sacco di ricerca per capire come questi attori interagiscono con Bitcoin.

Per etichettare queste entità, i ricercatori hanno usato informazioni provenienti da varie fonti, inclusi forum e database. Hanno affrontato una gamma di tipi di entità: dai miner che confermano le transazioni agli exchange dove le persone scambiano Bitcoin. Ogni entità riceve una bella etichetta, così è facile sapere di cosa si tratta.

BitcoinTalk – Il Nostro Tesoro

Per trovare queste etichette, i ricercatori si sono rivolti a BitcoinTalk, un forum pieno di discussioni su Bitcoin. Hanno setacciato i post e hanno estratto informazioni su indirizzi, contesti e attività riguardanti le transazioni Bitcoin.

Scrapando attraverso questo forum, hanno raccolto un incredibile numero di 14 milioni di messaggi. Sono un sacco di chiacchiere! Usando un'intelligenza artificiale astuta, hanno pulito i dati, fatto collegamenti e assegnato etichette agli indirizzi.

Mettendo Tutto Insieme

Una volta costruito il grafo, i ricercatori hanno addestrato diversi modelli per prevedere cosa rappresenta ogni nodo in base alle loro connessioni e caratteristiche. In questo modo, hanno testato quanto bene il dataset potesse aiutare a distinguere tra diversi tipi di utenti.

Validazione dei Dati

Per assicurarsi che tutto fosse a posto, i ricercatori hanno esaminato quanto bene potevano prevedere le etichette in base alle caratteristiche. Questo serve come modo per convalidare il dataset vedendo se può collegare i dati off-chain (come discussioni su internet) con i dati on-chain (transazioni effettive).

Uno Sguardo Rapido ai Casi d'Uso

Questo dataset non è un trucco da un solo colpo. Oltre a prevedere etichette, ci sono molti altri modi per usarlo:

  • Esaminare i Modelli di Interazione: Studiando come diversi tipi di entità interagiscono nel tempo, i ricercatori possono vedere come queste relazioni cambiano. Questo include cose come il riciclaggio di denaro e affari loschi.

  • Osservare i Cambiamenti nel Tempo: Tenere d'occhio come evolve il grafo di Bitcoin può rivelare molto sulla crescita e le tendenze della rete nel tempo.

  • Confrontare Reti: I ricercatori possono confrontare Bitcoin con altre reti economiche, aiutando a capire meglio le sue caratteristiche uniche.

Ottenere il Dataset

Il dataset è disponibile per chiunque voglia approfondire. Contiene un tesoro di informazioni, inclusi messaggi da BitcoinTalk, indirizzi etichettati e l'intero grafo memorizzato in un database.

Concludendo

Quindi, eccolo qui. Questo nuovo dataset è come una mappa che apre nuove strade per la ricerca sulle transazioni Bitcoin. Aiuta i ricercatori a collegare i punti tra gli utenti, rendendo più facile studiare come il valore fluisce attraverso questa valuta digitale.

Che tu sia un ricercatore pronto a metterti il cappello da esploratore o solo qualcuno curioso di come funziona Bitcoin, questo dataset è un'opportunità emozionante per saperne di più. Chissà? Forse troverai qualcosa di rivoluzionario che tutti gli altri hanno perso!

Fonte originale

Titolo: Bitcoin Research with a Transaction Graph Dataset

Estratto: Bitcoin, launched in 2008 by Satoshi Nakamoto, established a new digital economy where value can be stored and transferred in a fully decentralized manner - alleviating the need for a central authority. This paper introduces a large scale dataset in the form of a transactions graph representing transactions between Bitcoin users along with a set of tasks and baselines. The graph includes 252 million nodes and 785 million edges, covering a time span of nearly 13 years of and 670 million transactions. Each node and edge is timestamped. As for supervised tasks we provide two labeled sets i. a 33,000 nodes based on entity type and ii. nearly 100,000 Bitcoin addresses labeled with an entity name and an entity type. This is the largest publicly available data set of bitcoin transactions designed to facilitate advanced research and exploration in this domain, overcoming the limitations of existing datasets. Various graph neural network models are trained to predict node labels, establishing a baseline for future research. In addition, several use cases are presented to demonstrate the dataset's applicability beyond Bitcoin analysis. Finally, all data and source code is made publicly available to enable reproducibility of the results.

Autori: Hugo Schnoering, Michalis Vazirgiannis

Ultimo aggiornamento: 2024-11-15 00:00:00

Lingua: English

URL di origine: https://arxiv.org/abs/2411.10325

Fonte PDF: https://arxiv.org/pdf/2411.10325

Licenza: https://creativecommons.org/licenses/by-sa/4.0/

Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.

Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.

Altro dagli autori

Articoli simili