Novo Conjunto de Dados sobre o Lançamento do ZKsync Era para Pesquisa
Acesse um ano de dados do ZKsync pra pesquisa em blockchain.
Maria Inês Silva, Johnnatan Messias, Benjamin Livshits
― 10 min ler
Índice
- Desafios com Dados de Blockchain
- Por que Dados do ZKsync Era?
- Disponibilidade dos Dados do ZKsync
- Apoio à Pesquisa e Análise
- Estrutura do Artigo
- Detalhes do Conjunto de Dados
- Estrutura da Blockchain
- Exemplos de Análises
- Uso de Gás e Taxas de Transação
- Eventos e Implantação de Contratos
- Eventos de Troca
- Análise do Comportamento do Usuário
- Direções Futuras de Pesquisa
- MEV e Arbitragem
- Análise da Atividade do Usuário
- Ciência de Dados e Análise
- Conclusão
- Fonte original
- Ligações de referência
A tecnologia blockchain oferece uma forma de registrar Transações de maneira segura e transparente. Embora os dados nas blockchains sejam, em geral, abertos para qualquer um acessar, usar esses dados pode ser complicado e caro, especialmente para pesquisadores. Isso é especialmente verdade para sistemas Layer 2 (L2), como o ZKsync.
Para ajudar, montamos um conjunto de dados que contém um ano de atividade do ZKsync, uma solução específica de escalabilidade L2 para Ethereum. Esse conjunto de dados agora está disponível para todo mundo usar. Neste artigo, explicamos como criamos esse conjunto de dados, mostramos alguns exemplos do que pode ser feito com ele e descrevemos possibilidades de pesquisa futuras. O código relacionado a esse conjunto de dados pode ser encontrado online, facilitando para outros replicarem nosso trabalho.
Desafios com Dados de Blockchain
Uma das principais vantagens da tecnologia blockchain é que ela permite a descentralização, ou seja, nenhuma pessoa ou organização tem controle sobre a rede. No entanto, os dados dessas blockchains costumam ser difíceis de acessar, especialmente para quem não tem habilidades técnicas. Essa dificuldade pode atrasar o progresso da pesquisa em blockchain e sua adoção.
Atualmente, se alguém quiser obter dados de blockchain, tem algumas opções. Pode configurar um nó de arquivo para Ethereum ou um nó completo para Bitcoin, mas isso exige tecnologia avançada e pode ser caro. Para muitas pessoas, essa opção pode não ser prática. Também dá para usar provedores de RPC, mas isso pode ser complicado para quem não tem conhecimento técnico e pode levar a altos custos.
Outra opção é confiar em plataformas externas, como Etherscan ou Dune. Embora essas plataformas possam ser úteis, também podem ser caras e podem não atender às necessidades de todos, especialmente pesquisadores que precisam de acesso fácil aos dados.
Acreditamos que todo mundo interessado em dados de blockchain deveria ter um jeito fácil de acessar essa informação sem se preocupar com tecnologia ou custos altos. Nosso conjunto de dados oferece insights valiosos para várias finalidades de pesquisa, como entender padrões de transação, projetar airdrops, analisar tendências de mercado e mais.
Por que Dados do ZKsync Era?
O ZKsync Era é uma solução de escalabilidade L2 que foi lançada em março de 2023. Ela ajuda a blockchain do Ethereum a processar transações de maneira mais eficiente usando provas de conhecimento zero (ZKPs). Essa tecnologia permite que várias transações sejam processadas ao mesmo tempo, o que ajuda a manter os custos de transação baixos e incentiva mais usuários a participar.
Em julho de 2024, o ZKsync Era está entre as principais soluções L2, com bilhões de dólares bloqueados em seu ecossistema. Rollups como o ZKsync se tornaram cruciais para escalar o Ethereum, pois introduzem novas capacidades e atraem muitos usuários. No entanto, algumas questões ainda precisam de respostas, e a pesquisa nessa área ainda é limitada.
Dada a crescente importância das soluções L2, nosso conjunto de dados visa ajudar pesquisadores a estudarem o ZKsync de perto. Ao fornecer acesso a esses dados, esperamos incentivar mais pesquisas sobre o ZKsync e soluções L2 em geral.
Disponibilidade dos Dados do ZKsync
Para apoiar a pesquisa, disponibilizamos nosso conjunto de dados do ZKsync publicamente em um repositório do GitHub. Esse conjunto de dados contém um ano de informações cobrindo blocos, transações, Recibos e logs. Informações detalhadas sobre o conjunto de dados podem ser encontradas no repositório.
Apoio à Pesquisa e Análise
No nosso conjunto de dados, fornecemos aplicações potenciais que podem ajudar tanto pesquisadores quanto usuários. Por exemplo, nosso conjunto de dados pode auxiliar quem quer estudar taxas de transação e como o Gás é usado, eventos acionados por transações, trocas de tokens e outras atividades relevantes.
Reconhecemos que coletar dados de RPCs e serviços externos pode ser lento e caro. Por isso, tornamos nosso conjunto de dados do ZKsync fácil de baixar e usar, fornecendo código de exemplo para ajudar pesquisadores a processar e analisar os dados. Isso significa que a reprodutibilidade é possível, permitindo que outros verifiquem nossos resultados.
Estrutura do Artigo
Este artigo está estruturado para fornecer um entendimento claro sobre o conjunto de dados e sua importância. As seções incluem:
- Detalhes sobre o conjunto de dados e como foi criado.
- Exemplos de análises que podem ser realizadas.
- Desafios na coleta de dados, junto com nossas soluções.
- Direções de pesquisa futuras que podem ser exploradas com este conjunto de dados.
Detalhes do Conjunto de Dados
Nosso conjunto de dados do ZKsync cobre o período de 14 de fevereiro de 2023 a 24 de março de 2024. Inclui mais de 300 milhões de transações e cerca de 1,6 milhão de contratos implantados durante esse período. Esse conjunto de dados oferece uma visão abrangente de todas as atividades que ocorreram no ZKsync desde seu lançamento.
Os dados são coletados do nosso nó de arquivo do ZKsync Era. Inicialmente brutos, os dados passaram por uma etapa de pré-processamento onde os formatamos em um formato parquet. Isso facilita o acesso usando bibliotecas populares em Python, como Pandas e Polars. Dada a enorme quantidade de dados, usamos Polars para melhor desempenho e manuseio de memória.
Estrutura da Blockchain
Para entender os dados do ZKsync, é essencial perceber como blocos e transações interagem dentro da blockchain.
Blocos
Blocos são pedaços de dados em uma blockchain, cada um identificado por um hash único. Eles contêm informações de transação e metadados. Os blocos estão ligados em uma cadeia, garantindo que as transações sejam seguras, o consenso seja alcançado e os dados sejam processados de forma eficiente.
Transações
Transações representam ações na blockchain, como transferir ativos ou executar contratos. Cada transação é iniciada por um usuário e verificada por uma rede de nós. Uma vez validadas, as transações são agrupadas em blocos. O ZKsync agrega transações e as processa fora da blockchain principal, o que ajuda a reduzir custos e estresse na rede.
Transações incluem detalhes como o endereço do destinatário, valor, preço do gás e limite de gás. Gás representa a taxa que os usuários pagam para processar suas transações. Classificar transações por número de bloco ajuda a manter a ordem dentro da blockchain.
Recibos
Recibos de transação fornecem um resumo do resultado de cada transação assim que processada. Eles contêm detalhes como o hash da transação, número do bloco, gás usado e o custo incorrido. Essa informação é vital para usuários e desenvolvedores entenderem como as interações com contratos inteligentes ocorrem e quais taxas estão envolvidas.
Logs
Logs de transação são Registros de eventos acionados durante transações, especialmente envolvendo contratos inteligentes. Eles ajudam a rastrear várias atividades, como transferências e aprovações de tokens. Esses logs são essenciais para auxiliar na análise de blockchain e entender o comportamento do usuário na rede.
Exemplos de Análises
Usando nosso conjunto de dados, há várias análises que os pesquisadores podem realizar. Cada tipo de dado no conjunto pode gerar insights sobre a atividade no ZKsync.
Uso de Gás e Taxas de Transação
Uma área crítica de análise envolve olhar para transações, uso de gás e taxas. Ao examinar as transações diárias realizadas no ZKsync, podemos ver tendências e picos de atividade. Por exemplo, durante o período analisado, a rede teve uma média de cerca de 900.000 transações diárias, com surtos notáveis durante eventos específicos.
O uso de gás varia, e ao estudar isso, podemos entender quão eficientemente a rede opera. A análise pode revelar picos no uso de gás que muitas vezes correspondem a eventos como airdrops ou alta atividade de trading.
Eventos e Implantação de Contratos
Eventos emitidos por contratos inteligentes fornecem dados adicionais sobre a atividade da rede. Ao analisar os tipos de eventos mais frequentes, pudemos ver que eventos de Transferência representam a maior parte dos eventos emitidos. Entender esses eventos ajuda a esclarecer com que frequência os tokens são movimentados na rede.
A implantação de contratos também indica o crescimento e os níveis de atividade da rede. Observar os números diários de implantação de contratos pode revelar tendências no interesse dos desenvolvedores e na saúde geral do ecossistema ZKsync.
Eventos de Troca
Eventos de troca são particularmente importantes para exchanges descentralizadas (DEX). Ao olhar para o número de eventos de troca ao longo do tempo, é possível observar os níveis de atividade de trading e o comportamento geral do mercado. Analisar quais contratos estão envolvidos nas trocas pode ajudar a identificar pares de trading populares e dinâmicas de mercado.
Análise do Comportamento do Usuário
Analisar o comportamento do usuário é crucial para entender a dinâmica do ecossistema ZKsync. Ao examinar o número de transações por usuário, os pesquisadores podem identificar tendências como agricultores de airdrop e padrões de uso. Insights sobre como as redes sociais influenciam a atividade em blockchain também podem ser coletados a partir desses dados.
Direções Futuras de Pesquisa
Nosso conjunto de dados abre várias possibilidades para pesquisas futuras. Aqui estão algumas áreas onde os pesquisadores podem se beneficiar dessas informações.
MEV e Arbitragem
O Valor Mínimo Extraível (MEV) e a arbitragem são conceitos vitais na economia blockchain. Apesar de serem estudados em blockchains de Layer 1, a pesquisa em sistemas L2 como o ZKsync ainda é relativamente nova. Nosso conjunto de dados pode ajudar os pesquisadores a investigar estratégias de backrunning e oportunidades de arbitragem entre exchanges centralizadas e plataformas DEX.
Análise da Atividade do Usuário
Entender o comportamento do usuário no ZKsync pode levar a insights valiosos. Pesquisadores podem explorar as interações dos usuários com contratos inteligentes e identificar tendências como ataques Sybil, onde indivíduos criam várias contas para se beneficiar de airdrops ou outros incentivos. Essa análise pode ajudar as organizações a entender o engajamento dos usuários e desenvolver estratégias para combater práticas enganosas.
Ciência de Dados e Análise
Nosso conjunto de dados é um ótimo recurso para indivíduos interessados em análise de dados e ciência. Cientistas de dados podem usar essas informações em plataformas públicas para aprimorar suas habilidades e mostrar suas capacidades. Esse conjunto de dados pode servir como uma ferramenta educacional valiosa para quem procura entrar na indústria de blockchain.
Conclusão
Em resumo, embora a tecnologia blockchain tenha benefícios em termos de transparência e descentralização, acessar e utilizar dados de blockchain ainda pode apresentar desafios. Nossa iniciativa de liberar o conjunto de dados do ZKsync aborda esses desafios, tornando mais fácil para pesquisadores e entusiastas se aprofundarem no espaço blockchain.
Ao fornecer um ano de dados do ZKsync, esperamos enriquecer o cenário de pesquisa relacionado a sistemas L2 e estimular o interesse no potencial do ZKsync. Nosso conjunto de dados não apenas contribui para o corpo de pesquisa existente, mas também visa ser acessível a uma ampla gama de usuários, independente de sua expertise técnica.
Através desse esforço, acreditamos que insights valiosos surgirão, aprimorando a compreensão das dinâmicas de blockchain e fomentando mais inovações nesse campo empolgante.
Título: A Public Dataset For the ZKsync Rollup
Resumo: Despite blockchain data being publicly available, practical challenges and high costs often hinder its effective use by researchers, thus limiting data-driven research and exploration in the blockchain space. This is especially true when it comes to Layer~2 (L2) ecosystems, and ZKsync, in particular. To address these issues, we have curated a dataset from 1 year of activity extracted from a ZKsync Era archive node and made it freely available to external parties. In this paper, we provide details on this dataset and how it was created, showcase a few example analyses that can be performed with it, and discuss some future research directions. We also publish and share the code used in our analysis on GitHub to promote reproducibility and to support further research.
Autores: Maria Inês Silva, Johnnatan Messias, Benjamin Livshits
Última atualização: 2024-07-26 00:00:00
Idioma: English
Fonte URL: https://arxiv.org/abs/2407.18699
Fonte PDF: https://arxiv.org/pdf/2407.18699
Licença: https://creativecommons.org/licenses/by/4.0/
Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.
Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.
Ligações de referência
- https://github.com/matter-labs/zksync-data-dump/blob/main/notebooks/01-zksync-data.ipynb
- https://github.com/matter-labs/zksync-data-dump/blob/main/notebooks/02-data-exploration-fees.ipynb
- https://github.com/matter-labs/zksync-data-dump/blob/main/notebooks/03-data-exploration-contracts.ipynb
- https://github.com/matter-labs/zksync-data-dump/blob/main/notebooks/04-data-exploration-swaps.ipynb
- https://github.com/matter-labs/zksync-data-dump
- https://github.com/matter-labs/zksync-data-dump/tree/main/notebooks
- https://era.zksync.network/address/0x0000000000000000000000000000000000008001