Simple Science

Ciência de ponta explicada de forma simples

# Estatística# Criptografia e segurança# Aplicações

Novo Conjunto de Dados sobre o Lançamento do ZKsync Era para Pesquisa

Acesse um ano de dados do ZKsync pra pesquisa em blockchain.

Maria Inês Silva, Johnnatan Messias, Benjamin Livshits

― 10 min ler


Dados do ZKsync LiberadosDados do ZKsync Liberadospara Pesquisade análise de blockchain.Novo conjunto de dados apoia esforços
Índice

A tecnologia blockchain oferece uma forma de registrar Transações de maneira segura e transparente. Embora os dados nas blockchains sejam, em geral, abertos para qualquer um acessar, usar esses dados pode ser complicado e caro, especialmente para pesquisadores. Isso é especialmente verdade para sistemas Layer 2 (L2), como o ZKsync.

Para ajudar, montamos um conjunto de dados que contém um ano de atividade do ZKsync, uma solução específica de escalabilidade L2 para Ethereum. Esse conjunto de dados agora está disponível para todo mundo usar. Neste artigo, explicamos como criamos esse conjunto de dados, mostramos alguns exemplos do que pode ser feito com ele e descrevemos possibilidades de pesquisa futuras. O código relacionado a esse conjunto de dados pode ser encontrado online, facilitando para outros replicarem nosso trabalho.

Desafios com Dados de Blockchain

Uma das principais vantagens da tecnologia blockchain é que ela permite a descentralização, ou seja, nenhuma pessoa ou organização tem controle sobre a rede. No entanto, os dados dessas blockchains costumam ser difíceis de acessar, especialmente para quem não tem habilidades técnicas. Essa dificuldade pode atrasar o progresso da pesquisa em blockchain e sua adoção.

Atualmente, se alguém quiser obter dados de blockchain, tem algumas opções. Pode configurar um nó de arquivo para Ethereum ou um nó completo para Bitcoin, mas isso exige tecnologia avançada e pode ser caro. Para muitas pessoas, essa opção pode não ser prática. Também dá para usar provedores de RPC, mas isso pode ser complicado para quem não tem conhecimento técnico e pode levar a altos custos.

Outra opção é confiar em plataformas externas, como Etherscan ou Dune. Embora essas plataformas possam ser úteis, também podem ser caras e podem não atender às necessidades de todos, especialmente pesquisadores que precisam de acesso fácil aos dados.

Acreditamos que todo mundo interessado em dados de blockchain deveria ter um jeito fácil de acessar essa informação sem se preocupar com tecnologia ou custos altos. Nosso conjunto de dados oferece insights valiosos para várias finalidades de pesquisa, como entender padrões de transação, projetar airdrops, analisar tendências de mercado e mais.

Por que Dados do ZKsync Era?

O ZKsync Era é uma solução de escalabilidade L2 que foi lançada em março de 2023. Ela ajuda a blockchain do Ethereum a processar transações de maneira mais eficiente usando provas de conhecimento zero (ZKPs). Essa tecnologia permite que várias transações sejam processadas ao mesmo tempo, o que ajuda a manter os custos de transação baixos e incentiva mais usuários a participar.

Em julho de 2024, o ZKsync Era está entre as principais soluções L2, com bilhões de dólares bloqueados em seu ecossistema. Rollups como o ZKsync se tornaram cruciais para escalar o Ethereum, pois introduzem novas capacidades e atraem muitos usuários. No entanto, algumas questões ainda precisam de respostas, e a pesquisa nessa área ainda é limitada.

Dada a crescente importância das soluções L2, nosso conjunto de dados visa ajudar pesquisadores a estudarem o ZKsync de perto. Ao fornecer acesso a esses dados, esperamos incentivar mais pesquisas sobre o ZKsync e soluções L2 em geral.

Disponibilidade dos Dados do ZKsync

Para apoiar a pesquisa, disponibilizamos nosso conjunto de dados do ZKsync publicamente em um repositório do GitHub. Esse conjunto de dados contém um ano de informações cobrindo blocos, transações, Recibos e logs. Informações detalhadas sobre o conjunto de dados podem ser encontradas no repositório.

Apoio à Pesquisa e Análise

No nosso conjunto de dados, fornecemos aplicações potenciais que podem ajudar tanto pesquisadores quanto usuários. Por exemplo, nosso conjunto de dados pode auxiliar quem quer estudar taxas de transação e como o Gás é usado, eventos acionados por transações, trocas de tokens e outras atividades relevantes.

Reconhecemos que coletar dados de RPCs e serviços externos pode ser lento e caro. Por isso, tornamos nosso conjunto de dados do ZKsync fácil de baixar e usar, fornecendo código de exemplo para ajudar pesquisadores a processar e analisar os dados. Isso significa que a reprodutibilidade é possível, permitindo que outros verifiquem nossos resultados.

Estrutura do Artigo

Este artigo está estruturado para fornecer um entendimento claro sobre o conjunto de dados e sua importância. As seções incluem:

  1. Detalhes sobre o conjunto de dados e como foi criado.
  2. Exemplos de análises que podem ser realizadas.
  3. Desafios na coleta de dados, junto com nossas soluções.
  4. Direções de pesquisa futuras que podem ser exploradas com este conjunto de dados.

Detalhes do Conjunto de Dados

Nosso conjunto de dados do ZKsync cobre o período de 14 de fevereiro de 2023 a 24 de março de 2024. Inclui mais de 300 milhões de transações e cerca de 1,6 milhão de contratos implantados durante esse período. Esse conjunto de dados oferece uma visão abrangente de todas as atividades que ocorreram no ZKsync desde seu lançamento.

Os dados são coletados do nosso nó de arquivo do ZKsync Era. Inicialmente brutos, os dados passaram por uma etapa de pré-processamento onde os formatamos em um formato parquet. Isso facilita o acesso usando bibliotecas populares em Python, como Pandas e Polars. Dada a enorme quantidade de dados, usamos Polars para melhor desempenho e manuseio de memória.

Estrutura da Blockchain

Para entender os dados do ZKsync, é essencial perceber como blocos e transações interagem dentro da blockchain.

Blocos

Blocos são pedaços de dados em uma blockchain, cada um identificado por um hash único. Eles contêm informações de transação e metadados. Os blocos estão ligados em uma cadeia, garantindo que as transações sejam seguras, o consenso seja alcançado e os dados sejam processados de forma eficiente.

Transações

Transações representam ações na blockchain, como transferir ativos ou executar contratos. Cada transação é iniciada por um usuário e verificada por uma rede de nós. Uma vez validadas, as transações são agrupadas em blocos. O ZKsync agrega transações e as processa fora da blockchain principal, o que ajuda a reduzir custos e estresse na rede.

Transações incluem detalhes como o endereço do destinatário, valor, preço do gás e limite de gás. Gás representa a taxa que os usuários pagam para processar suas transações. Classificar transações por número de bloco ajuda a manter a ordem dentro da blockchain.

Recibos

Recibos de transação fornecem um resumo do resultado de cada transação assim que processada. Eles contêm detalhes como o hash da transação, número do bloco, gás usado e o custo incorrido. Essa informação é vital para usuários e desenvolvedores entenderem como as interações com contratos inteligentes ocorrem e quais taxas estão envolvidas.

Logs

Logs de transação são Registros de eventos acionados durante transações, especialmente envolvendo contratos inteligentes. Eles ajudam a rastrear várias atividades, como transferências e aprovações de tokens. Esses logs são essenciais para auxiliar na análise de blockchain e entender o comportamento do usuário na rede.

Exemplos de Análises

Usando nosso conjunto de dados, há várias análises que os pesquisadores podem realizar. Cada tipo de dado no conjunto pode gerar insights sobre a atividade no ZKsync.

Uso de Gás e Taxas de Transação

Uma área crítica de análise envolve olhar para transações, uso de gás e taxas. Ao examinar as transações diárias realizadas no ZKsync, podemos ver tendências e picos de atividade. Por exemplo, durante o período analisado, a rede teve uma média de cerca de 900.000 transações diárias, com surtos notáveis durante eventos específicos.

O uso de gás varia, e ao estudar isso, podemos entender quão eficientemente a rede opera. A análise pode revelar picos no uso de gás que muitas vezes correspondem a eventos como airdrops ou alta atividade de trading.

Eventos e Implantação de Contratos

Eventos emitidos por contratos inteligentes fornecem dados adicionais sobre a atividade da rede. Ao analisar os tipos de eventos mais frequentes, pudemos ver que eventos de Transferência representam a maior parte dos eventos emitidos. Entender esses eventos ajuda a esclarecer com que frequência os tokens são movimentados na rede.

A implantação de contratos também indica o crescimento e os níveis de atividade da rede. Observar os números diários de implantação de contratos pode revelar tendências no interesse dos desenvolvedores e na saúde geral do ecossistema ZKsync.

Eventos de Troca

Eventos de troca são particularmente importantes para exchanges descentralizadas (DEX). Ao olhar para o número de eventos de troca ao longo do tempo, é possível observar os níveis de atividade de trading e o comportamento geral do mercado. Analisar quais contratos estão envolvidos nas trocas pode ajudar a identificar pares de trading populares e dinâmicas de mercado.

Análise do Comportamento do Usuário

Analisar o comportamento do usuário é crucial para entender a dinâmica do ecossistema ZKsync. Ao examinar o número de transações por usuário, os pesquisadores podem identificar tendências como agricultores de airdrop e padrões de uso. Insights sobre como as redes sociais influenciam a atividade em blockchain também podem ser coletados a partir desses dados.

Direções Futuras de Pesquisa

Nosso conjunto de dados abre várias possibilidades para pesquisas futuras. Aqui estão algumas áreas onde os pesquisadores podem se beneficiar dessas informações.

MEV e Arbitragem

O Valor Mínimo Extraível (MEV) e a arbitragem são conceitos vitais na economia blockchain. Apesar de serem estudados em blockchains de Layer 1, a pesquisa em sistemas L2 como o ZKsync ainda é relativamente nova. Nosso conjunto de dados pode ajudar os pesquisadores a investigar estratégias de backrunning e oportunidades de arbitragem entre exchanges centralizadas e plataformas DEX.

Análise da Atividade do Usuário

Entender o comportamento do usuário no ZKsync pode levar a insights valiosos. Pesquisadores podem explorar as interações dos usuários com contratos inteligentes e identificar tendências como ataques Sybil, onde indivíduos criam várias contas para se beneficiar de airdrops ou outros incentivos. Essa análise pode ajudar as organizações a entender o engajamento dos usuários e desenvolver estratégias para combater práticas enganosas.

Ciência de Dados e Análise

Nosso conjunto de dados é um ótimo recurso para indivíduos interessados em análise de dados e ciência. Cientistas de dados podem usar essas informações em plataformas públicas para aprimorar suas habilidades e mostrar suas capacidades. Esse conjunto de dados pode servir como uma ferramenta educacional valiosa para quem procura entrar na indústria de blockchain.

Conclusão

Em resumo, embora a tecnologia blockchain tenha benefícios em termos de transparência e descentralização, acessar e utilizar dados de blockchain ainda pode apresentar desafios. Nossa iniciativa de liberar o conjunto de dados do ZKsync aborda esses desafios, tornando mais fácil para pesquisadores e entusiastas se aprofundarem no espaço blockchain.

Ao fornecer um ano de dados do ZKsync, esperamos enriquecer o cenário de pesquisa relacionado a sistemas L2 e estimular o interesse no potencial do ZKsync. Nosso conjunto de dados não apenas contribui para o corpo de pesquisa existente, mas também visa ser acessível a uma ampla gama de usuários, independente de sua expertise técnica.

Através desse esforço, acreditamos que insights valiosos surgirão, aprimorando a compreensão das dinâmicas de blockchain e fomentando mais inovações nesse campo empolgante.

Mais de autores

Artigos semelhantes