Uma Olhada Completa nas Transações de Bitcoin
Explorando um novo conjunto de dados de transações de Bitcoin pra entender melhor as coisas.
Hugo Schnoering, Michalis Vazirgiannis
― 8 min ler
Índice
- A Grande Imagem
- O Conjunto de Dados
- O Gráfico Explicado
- As Tarefas Supervisionadas
- Por Que o Bitcoin é Especial?
- O Jogo das Transações
- Montando o Gráfico
- Definindo Nós
- Desenhando Conexões
- Características Únicas do Conjunto de Dados
- Diferentes Tipos de Entidades
- BitcoinTalk – Nosso Tesouro
- Juntando Tudo
- Validação dos Dados
- Um Olhar Rápido sobre Casos de Uso
- Pegando o Conjunto de Dados
- Finalizando
- Fonte original
- Ligações de referência
O Bitcoin começou em 2008, criado por alguém que usa o nome Satoshi Nakamoto. Foi a primeira tentativa real de uma moeda digital que não precisava de um banco ou governo pra controlar as coisas. Em vez disso, deixou que as pessoas trocassem valor diretamente entre si. Esse artigo fala sobre um super conjunto de dados que analisa todas as transações feitas com Bitcoin, representadas como um gráfico. Então, o que isso significa? Bem, pense nele como um grande mapa mostrando quem tá mandando grana pra quem.
A Grande Imagem
Então, o Bitcoin é tudo sobre criar um novo tipo de economia. Nessa economia, você pode guardar seu dinheiro e enviar pra outra pessoa sem precisar de banco pra fazer isso. O Bitcoin funciona com um conjunto de regras que todo mundo concorda. Diferente do dinheiro tradicional, não tem uma autoridade central controlando a inflação ou verificando transações. Em vez disso, o Bitcoin usa uma rede de usuários que trabalham juntos pra garantir que tudo funcione direitinho.
Desde que o Bitcoin surgiu, cada vez mais pessoas começaram a usar. Em 2023, cerca de 270 mil usuários entravam na onda do Bitcoin todo dia, movimentando uns impressionantes $8,6 trilhões. É muita pizza! Os pesquisadores também têm se interessado bastante pelo Bitcoin, com milhares de estudos surgindo todo ano em busca de respostas e insights desse mundo digital.
O Conjunto de Dados
Apesar de todos os dados públicos disponíveis sobre transações de Bitcoin, encontrar um conjunto de dados sólido pra pesquisa é como procurar uma agulha no palheiro. Muitos caras focaram em deixar o Bitcoin mais seguro e útil, mas ainda tem uma boa quantidade de desafios, como fraudes e outros comportamentos suspeitos.
Esse artigo apresenta um grande conjunto de dados que mapeia as transações de Bitcoin. Esse conjunto não é só algumas transações mixurucas – ele inclui mais de 252 milhões de Nós e 785 milhões de conexões ao longo de quase 13 anos! Esse conjunto de dados é uma grande conquista porque é o maior conjunto de dados de transações de Bitcoin disponível publicamente, facilitando a vida dos pesquisadores.
O Gráfico Explicado
Nesse gráfico, cada nó representa um usuário, organização ou instituição identificável envolvida com Bitcoin, como pessoas reais ou empresas. As conexões representam o fluxo de dinheiro entre esses nós. Boas notícias: tudo nesse conjunto de dados tem um timestamp, então os pesquisadores conseguem ver a linha do tempo das transações, facilitando o estudo de padrões ao longo do tempo.
As Tarefas Supervisionadas
Pra deixar a análise mais tranquila, os pesquisadores montaram dois conjuntos etiquetados:
- Um com 33 mil nós baseado no tipo de entidades que são (como pessoas ou empresas).
- Outro com quase 100 mil endereços de Bitcoin marcados pra todo mundo saber a quem pertencem.
Esse conjunto de dados é maior e melhor que os anteriores. Pra deixar as coisas ainda mais empolgantes, os pesquisadores treinaram diferentes modelos pra prever rótulos dos nós, assim puderam estabelecer uma linha de base para pesquisas futuras. Pense nisso como dar um mapa pros pesquisadores enquanto eles vagam por uma selva digital.
Por Que o Bitcoin é Especial?
O Bitcoin é diferente das moedas normais de uma maneira bem grande. Ele usa algo chamado criptografia assimétrica, onde cada usuário tem uma chave privada pra manter seus fundos seguros. Essa chave nunca é compartilhada com ninguém. Em vez disso, as pessoas interagem usando endereços ligados às suas chaves privadas.
Cada Bitcoin é guardado em algo chamado Transaction Output (TXO). Um TXO tem um valor e um script de bloqueio que diz como usar. Isso mesmo, você não pode simplesmente entrar e pegar; tem que seguir as regras!
O Jogo das Transações
Quando você faz uma transação, você pega alguns TXOs, gasta eles e cria novos. Se o valor que você gasta for menor ou igual ao que você recebe, tá tudo certo. Nesse jogo, o TXO vai de não gasto pra gasto, pronto pra uso futuro.
A maioria das pessoas pensa nas transações de Bitcoin como se estivesse movendo dinheiro. Na real, é tudo sobre mudar TXOs de um lugar pra outro, agitando um pouco as coisas enquanto mantém tudo na legalidade.
Montando o Gráfico
Ao montar esse grande conjunto de dados, os pesquisadores tiveram que puxar dados da blockchain do Bitcoin, que é como um livro-razão público onde todas as transações são registradas. Os pesquisadores instalaram um nó especial do Bitcoin, baixaram todos os dados das transações e começaram a organizar tudo.
Definindo Nós
Todo o Bitcoin que tá por aí tá trancado em TXOs não gastos, e é daí que os pesquisadores tiraram a ideia dos nós. Eles deram uma olhada nos scripts de bloqueio que mantêm os fundos seguros e usaram isso como base pra identificar as entidades reais por trás de cada nó.
Usando algumas manhas de pesquisas anteriores, os pesquisadores fizeram conexões entre os scripts e identificaram quem tava por trás da grana. No final, descobriram mais de 874 milhões de scripts, que agruparam em clusters que representam usuários reais.
Desenhando Conexões
Agora, quando se trata de definir conexões – ou arestas – entre nós, a verdadeira diversão começa. Quando os usuários enviam e recebem dinheiro, os pesquisadores precisam entender quem tá enviando e quem tá recebendo.
Se um nó (o remetente) envia valor pra outro nó (o receptor), eles criam uma aresta que mostra essa transação. Tem algumas transações especiais pra ficar de olho, como as transações CoinJoin, que misturam dinheiro de diferentes usuários pra manter tudo privado. Essas são um pouco complicadas, então os pesquisadores decidiram deixá-las de fora ao construir o conjunto de dados.
Características Únicas do Conjunto de Dados
O conjunto de dados não é só um monte de números; ele vem com algumas características legais. Cada aresta no gráfico carrega informações sobre as transações, enquanto cada nó compartilha insights sobre o comportamento das entidades conectadas.
Diferentes Tipos de Entidades
O ecossistema do Bitcoin é cheio de jogadores com papéis diferentes. Podem ser pessoas comuns, empresas ou até operadores suspeitos. Tem um monte de pesquisa rolando pra entender como esses atores interagem com o Bitcoin.
Pra rotular essas entidades, os pesquisadores usaram informações de várias fontes, incluindo fóruns e bancos de dados. Eles lidaram com uma gama de tipos de entidades: desde mineradores que confirmam transações até exchanges onde as pessoas negociam Bitcoin. Cada entidade ganha um rótulo maneiro, então é fácil saber do que se trata.
BitcoinTalk – Nosso Tesouro
Pra encontrar esses rótulos, os pesquisadores correram pro BitcoinTalk, um fórum cheio de discussões sobre Bitcoin. Eles pesquisaram as postagens e puxaram informações sobre endereços, contextos e atividades envolvendo transações de Bitcoin.
Dando uma garimpada nesse fórum, eles coletaram impressionantes 14 milhões de mensagens. É muita conversa! Usando uma IA esperta, eles limparam os dados, fizeram conexões e atribuíram rótulos aos endereços.
Juntando Tudo
Assim que o gráfico foi construído, os pesquisadores treinaram vários modelos pra prever o que cada nó representa baseado nas suas conexões e características. Ao fazer isso, testaram quão bem o conjunto de dados poderia ajudar a distinguir os diferentes tipos de usuários.
Validação dos Dados
Pra garantir que tudo tava certo, os pesquisadores analisaram quão bem podiam prever rótulos baseado nas características. Isso serve como uma forma de validar o conjunto de dados, vendo se ele consegue conectar dados off-chain (como discussões na internet) com os dados on-chain (transações reais).
Um Olhar Rápido sobre Casos de Uso
Esse conjunto de dados não é só um truque. Além de prever rótulos, tem muitas outras maneiras de usar:
-
Analisando Padrões de Interação: Estudando como diferentes tipos de entidades interagem ao longo do tempo, os pesquisadores podem ver como essas relações mudam. Isso inclui coisas como lavagem de dinheiro e negócios suspeitos.
-
Observando Mudanças ao Longo do Tempo: Ficar de olho em como o gráfico do Bitcoin evolui pode revelar muito sobre o crescimento e as tendências da rede ao longo do tempo.
-
Comparando Redes: Os pesquisadores podem comparar o Bitcoin com outras redes econômicas, ajudando a entender melhor suas características únicas.
Pegando o Conjunto de Dados
O conjunto de dados tá disponível pra quem quiser se aventurar. Ele contém um tesouro de informações, incluindo mensagens do BitcoinTalk, endereços rotulados e o gráfico inteiro guardado em um banco de dados.
Finalizando
Então, é isso. Esse novo conjunto de dados é como um mapa que abre novos caminhos pra pesquisa sobre transações de Bitcoin. Ajuda os pesquisadores a conectar os pontos entre os usuários, facilitando o estudo de como o valor flui por essa moeda digital.
Seja você um pesquisador procurando colocar o chapéu de explorador ou apenas alguém curioso sobre como o Bitcoin funciona, esse conjunto de dados é uma oportunidade empolgante pra aprender mais. Quem sabe? Talvez você descubra algo inovador que todo mundo perdeu!
Título: Bitcoin Research with a Transaction Graph Dataset
Resumo: Bitcoin, launched in 2008 by Satoshi Nakamoto, established a new digital economy where value can be stored and transferred in a fully decentralized manner - alleviating the need for a central authority. This paper introduces a large scale dataset in the form of a transactions graph representing transactions between Bitcoin users along with a set of tasks and baselines. The graph includes 252 million nodes and 785 million edges, covering a time span of nearly 13 years of and 670 million transactions. Each node and edge is timestamped. As for supervised tasks we provide two labeled sets i. a 33,000 nodes based on entity type and ii. nearly 100,000 Bitcoin addresses labeled with an entity name and an entity type. This is the largest publicly available data set of bitcoin transactions designed to facilitate advanced research and exploration in this domain, overcoming the limitations of existing datasets. Various graph neural network models are trained to predict node labels, establishing a baseline for future research. In addition, several use cases are presented to demonstrate the dataset's applicability beyond Bitcoin analysis. Finally, all data and source code is made publicly available to enable reproducibility of the results.
Autores: Hugo Schnoering, Michalis Vazirgiannis
Última atualização: 2024-11-15 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2411.10325
Fonte PDF: https://arxiv.org/pdf/2411.10325
Licença: https://creativecommons.org/licenses/by-sa/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://bitcointalk.org/
- https://coinmarketcap.com
- https://figshare.com/articles/dataset/BitcoinTemporalGraph/26305093
- https://doi.org/10.6084/m9.figshare.26305093.v1
- https://github.com/hugoschnoering2/BTCGraphConstruction
- https://github.com/hugoschnoering2/BTCGraphLabeling
- https://github.com/hugoschnoering2/BTCGraphPredictingLabel