Una mirada completa a las transacciones de Bitcoin
Explorando un nuevo conjunto de datos de transacciones de Bitcoin para obtener información más profunda.
Hugo Schnoering, Michalis Vazirgiannis
― 8 minilectura
Tabla de contenidos
- La Gran Imagen
- El Conjunto de Datos
- El Gráfico Explicado
- Las Tareas Supervisadas
- ¿Por qué es Especial Bitcoin?
- El Juego de las Transacciones
- Construyendo el Gráfico
- Definiendo Nodos
- Dibujando Conexiones
- Características Únicas del Conjunto de Datos
- Diferentes Tipos de Entidades
- BitcoinTalk – Nuestro Tesoro
- Juntando Todo
- Validación de Datos
- Un Vistazo Rápido a los Casos de Uso
- Consiguiendo el Conjunto de Datos
- En Resumen
- Fuente original
- Enlaces de referencia
Bitcoin empezó en 2008, creado por alguien que usa el nombre Satoshi Nakamoto. Fue el primer intento real de una moneda digital que no necesitaba un banco o un gobierno para llevar el control. En vez de eso, dejaba que la gente intercambiara valor directamente entre ellos. Este documento habla sobre un conjunto enorme de datos que examina todas las transacciones hechas con Bitcoin, representadas en un gráfico. Entonces, ¿qué significa eso? Bueno, piénsalo como un gran mapa que muestra quién envía dinero a quién.
La Gran Imagen
Así que, Bitcoin se trata de crear un nuevo tipo de economía. En esta economía, puedes conservar tu dinero y enviarlo a otra persona sin necesitar un banco para hacerlo. Bitcoin opera bajo un conjunto de reglas en las que todos están de acuerdo. A diferencia del dinero tradicional, no hay una autoridad central que gestione la inflación o verifique las transacciones. En su lugar, Bitcoin utiliza una red de usuarios que trabajan juntos para asegurarse de que todo funcione sin problemas.
Desde que Bitcoin nació, cada vez más personas han empezado a usarlo. Para 2023, alrededor de 270,000 usuarios se subían al tren de Bitcoin cada día, moviendo unos impresionantes $8.6 billones. ¡Eso es un montón de pizza! Los investigadores también han mostrado un gran interés en Bitcoin, con miles de estudios saliendo cada año en busca de respuestas y perspectivas sobre esta maravilla digital.
El Conjunto de Datos
A pesar de todos los datos públicos disponibles sobre transacciones de Bitcoin, encontrar un conjunto de datos sólido para investigar es como buscar una aguja en un pajar. Muchos se han centrado en hacer Bitcoin más seguro y útil, pero todavía hay un buen número de desafíos, como el fraude y otros comportamientos engañosos.
Este artículo presenta un gran conjunto de datos que mapea las transacciones de Bitcoin. Este conjunto de datos no es solo unas pocas transacciones, incluye más de 252 millones de Nodos y 785 millones de conexiones, ¡durante casi 13 años! Este conjunto de datos es un gran negocio porque es el más grande de datos de transacciones de Bitcoin disponible públicamente, facilitando la vida a los investigadores.
El Gráfico Explicado
En este gráfico, cada nodo representa a un usuario, organización o institución identificable involucrada en Bitcoin, como personas reales o empresas. Las conexiones representan el flujo de dinero entre estos nodos. Buenas noticias: todo en este conjunto de datos tiene marcas de tiempo, así que los investigadores pueden ver la línea de tiempo de las transacciones, haciendo más fácil estudiar patrones con el tiempo.
Las Tareas Supervisadas
Para hacer el análisis más fluido, los investigadores establecieron dos conjuntos etiquetados:
- Uno con 33,000 nodos basado en qué tipo de entidades son (como personas o empresas).
- Otro con casi 100,000 direcciones de Bitcoin etiquetadas para que todos sepan a quién pertenecen.
Este conjunto de datos es más grande y mejor que los anteriores. Para hacer las cosas aún más emocionantes, los investigadores entrenaron diferentes modelos para predecir etiquetas de nodos, así pueden establecer una línea de base para futuras investigaciones. Piénsalo como darle a los investigadores un mapa mientras se aventuran por una jungla digital.
¿Por qué es Especial Bitcoin?
Bitcoin es diferente de las monedas regulares de una gran manera. Usa algo llamado criptografía asimétrica, donde cada usuario tiene una clave privada para mantener sus fondos seguros. Esta clave nunca se comparte con nadie. En su lugar, la gente interactúa usando direcciones que están vinculadas a sus claves privadas.
Cada Bitcoin se guarda en algo llamado un Resultado de Transacción (TXO). Un TXO tiene un valor y un script de bloqueo que nos dice cómo usarlo. Así es, no puedes simplemente entrar y tomarlo; ¡tienes que seguir las reglas!
El Juego de las Transacciones
Cuando realizas una transacción, tomas algunos TXOs, los gastas y creas nuevos. Si la cantidad que gastas es menor o igual a la cantidad que recibes, todo está bien. En este juego, el TXO pasa de no gastado a gastado, listo para su uso futuro.
La mayoría de la gente piensa en las transacciones de Bitcoin como mover dinero. En realidad, se trata de cambiar TXOs de un lugar a otro, agitando un poco las cosas mientras se mantiene todo legítimo.
Construyendo el Gráfico
Al establecer este gran conjunto de datos, los investigadores tuvieron que sacar datos de la blockchain de Bitcoin, que es como un libro de contabilidad público donde se registran todas las transacciones. Los investigadores instalaron un nodo especial de Bitcoin, descargaron todos los datos de transacciones y empezaron a revisarlos.
Definiendo Nodos
Todo el Bitcoin que hay está bloqueado en TXOs no gastados, y ahí fue donde los investigadores obtuvieron la idea para los nodos. Miraron los scripts de bloqueo que mantienen los fondos seguros y usaron eso como base para identificar las entidades reales detrás de cada nodo.
Usando algunos trucos inteligentes de investigaciones anteriores, los investigadores hicieron conexiones entre scripts e identificaron quién estaba detrás del dinero. Al final, descubrieron más de 874 millones de scripts, que agruparon en clústeres que representan usuarios reales.
Dibujando Conexiones
Ahora, cuando se trata de definir conexiones – o Bordes – entre nodos, ahí es donde comienza la verdadera diversión. Cuando los usuarios envían y reciben dinero, los investigadores necesitan entender quién está enviando y quién está recibiendo.
Si un nodo (el remitente) envía valor a otro nodo (el receptor), crean un borde que muestra esta transacción. Hay un par de transacciones especiales a tener en cuenta, como las transacciones de CoinJoin, que mezclan dinero de diferentes usuarios para mantenerlo privado. Estas son un poco complicadas, así que los investigadores decidieron dejarlas fuera al construir su conjunto de datos.
Características Únicas del Conjunto de Datos
El conjunto de datos no es solo un gran montón de números; viene con algunas características geniales. Cada borde en el gráfico lleva información sobre las transacciones, mientras que cada nodo comparte conocimientos sobre el comportamiento de las entidades conectadas.
Diferentes Tipos de Entidades
El ecosistema de Bitcoin está lleno de jugadores con diferentes roles. Estos pueden ser personas comunes, empresas o incluso operadores sospechosos. Se está haciendo un montón de investigación para entender cómo estos actores interactúan con Bitcoin.
Para etiquetar estas entidades, los investigadores usaron información de varias fuentes, incluyendo foros y bases de datos. Abordaron una variedad de tipos de entidades: desde mineros que confirman transacciones hasta exchanges donde la gente comercia Bitcoin. Cada entidad recibe una pequeña etiqueta, para que sea fácil saber de qué se trata.
BitcoinTalk – Nuestro Tesoro
Para encontrar estas etiquetas, los investigadores se dirigieron a BitcoinTalk, un foro lleno de discusiones sobre Bitcoin. Revisaron las publicaciones y sacaron información sobre direcciones, contexto y actividades relacionadas con transacciones de Bitcoin.
Al raspar este foro, recopilaron la asombrosa cantidad de 14 millones de mensajes. ¡Eso es un montón de charla! Usando una inteligencia artificial ingeniosa, limpiaron los datos, hicieron conexiones y asignaron etiquetas a las direcciones.
Juntando Todo
Una vez que se construyó el gráfico, los investigadores entrenaron varios modelos para predecir qué representa cada nodo basado en sus conexiones y características. Al hacer esto, probaron qué tan bien el conjunto de datos podía ayudar a distinguir entre diferentes tipos de usuarios.
Validación de Datos
Para asegurarse de que todo estuviera en orden, los investigadores analizaron qué tan bien podían predecir etiquetas basadas en las características. Esto sirve como una forma de validar el conjunto de datos al ver si puede conectar datos fuera de la cadena (como discusiones en internet) con los datos en la cadena (transacciones reales).
Un Vistazo Rápido a los Casos de Uso
Este conjunto de datos no es un truco único. Además de predecir etiquetas, hay muchas otras formas de usarlo:
-
Observando Patrones de Interacción: Al estudiar cómo interactúan diferentes tipos de entidades a lo largo del tiempo, los investigadores pueden ver cómo cambian estas relaciones. Esto incluye cosas como el blanqueo de dinero y tratos sospechosos.
-
Observando Cambios con el Tiempo: Mantener un ojo en cómo evoluciona el gráfico de Bitcoin puede decir mucho sobre el crecimiento de la red y tendencias a lo largo del tiempo.
-
Comparando Redes: Los investigadores pueden comparar Bitcoin con otras redes económicas, ayudando a entender mejor sus características únicas.
Consiguiendo el Conjunto de Datos
El conjunto de datos está disponible para cualquiera que quiera zambullirse. Contiene un tesoro de información, incluyendo mensajes de BitcoinTalk, direcciones etiquetadas y todo el gráfico almacenado en una base de datos.
En Resumen
Así que ahí lo tienes. Este nuevo conjunto de datos es como un mapa que abre nuevos caminos para la investigación sobre transacciones de Bitcoin. Ayuda a los investigadores a conectar los puntos entre los usuarios, facilitando el estudio de cómo fluye el valor a través de esta moneda digital.
Ya sea que seas un investigador listo para ponerte el sombrero de explorador o solo alguien curioso sobre cómo funciona Bitcoin, este conjunto de datos es una oportunidad emocionante para aprender más. ¡Quién sabe? Tal vez encuentres algo innovador que todos los demás pasaron por alto.
Título: Bitcoin Research with a Transaction Graph Dataset
Resumen: Bitcoin, launched in 2008 by Satoshi Nakamoto, established a new digital economy where value can be stored and transferred in a fully decentralized manner - alleviating the need for a central authority. This paper introduces a large scale dataset in the form of a transactions graph representing transactions between Bitcoin users along with a set of tasks and baselines. The graph includes 252 million nodes and 785 million edges, covering a time span of nearly 13 years of and 670 million transactions. Each node and edge is timestamped. As for supervised tasks we provide two labeled sets i. a 33,000 nodes based on entity type and ii. nearly 100,000 Bitcoin addresses labeled with an entity name and an entity type. This is the largest publicly available data set of bitcoin transactions designed to facilitate advanced research and exploration in this domain, overcoming the limitations of existing datasets. Various graph neural network models are trained to predict node labels, establishing a baseline for future research. In addition, several use cases are presented to demonstrate the dataset's applicability beyond Bitcoin analysis. Finally, all data and source code is made publicly available to enable reproducibility of the results.
Autores: Hugo Schnoering, Michalis Vazirgiannis
Última actualización: 2024-11-15 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2411.10325
Fuente PDF: https://arxiv.org/pdf/2411.10325
Licencia: https://creativecommons.org/licenses/by-sa/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.
Enlaces de referencia
- https://bitcointalk.org/
- https://coinmarketcap.com
- https://figshare.com/articles/dataset/BitcoinTemporalGraph/26305093
- https://doi.org/10.6084/m9.figshare.26305093.v1
- https://github.com/hugoschnoering2/BTCGraphConstruction
- https://github.com/hugoschnoering2/BTCGraphLabeling
- https://github.com/hugoschnoering2/BTCGraphPredictingLabel