ZKsyncエラの新しいデータセットが研究用に発表されたよ。
ブロックチェーン研究のために、ZKsyncの1年分のデータにアクセスしよう。
Maria Inês Silva, Johnnatan Messias, Benjamin Livshits
― 1 分で読む
目次
ブロックチェーン技術は、取引を安全かつ透明に記録する方法を提供してるんだ。ブロックチェーンのデータは一般的に誰でもアクセスできるけど、実際にそのデータを使うのは難しかったり、費用がかかったりすることが多い。特に研究者にとってはね。これは特にLayer 2(L2)システム、例えばZKsyncに当てはまる。
そこで、私たちはZKsyncの1年間の活動データをまとめたデータセットを作成したよ。これはEthereumの特定のL2スケーリングソリューションなんだ。このデータセットは誰でも使えるようになってる。この記事では、このデータセットをどうやって作ったか、どんなことができるかの例を示し、今後の研究の可能性について説明するよ。このデータセットに関連するコードはオンラインで見つけられるから、他の人が私たちの仕事を再現するのも簡単になるよ。
ブロックチェーンデータの課題
ブロックチェーン技術の大きな利点の一つは、非中央集権を可能にすることだ。つまり、ネットワークをコントロールするのは一人や一組織だけではないってこと。でも、これらのブロックチェーンのデータはアクセスが難しいことが多くて、特に技術的な知識がない人には厳しいんだ。この難しさが、ブロックチェーン研究の進展や普及を妨げてしまうことがあるんだ。
今のところ、ブロックチェーンのデータを取得したい人にはいくつかの選択肢がある。Ethereumのアーカイブノードをセットアップしたり、Bitcoinのフルノードを設置することができるけど、これには高度な技術が必要だし、コストもかかる。多くの人にとって、この選択肢は実用的じゃないかもしれない。また、RPCプロバイダーを使う手もあるけど、技術的な知識がない人にとってはこれも難しくて、高コストになることもある。
もう一つの選択肢は、EtherscanやDuneのような外部プラットフォームに依存すること。しかし、これらのプラットフォームは便利だけど、高額になることがあるし、特に研究者のようにデータへの簡単なアクセスを求める人には向かないかもしれない。
私たちは、ブロックチェーンデータに興味があるすべての人が、技術や高コストを気にすることなく、簡単にこの情報にアクセスできるべきだと考えている。私たちのデータセットは、取引パターンの理解やエアドロップの設計、市場動向の分析など、さまざまな研究目的に役立つ貴重な洞察を提供するよ。
なんでZKsync Eraデータなの?
ZKsync Eraは、2023年3月にローンチされたL2スケーリングソリューションだ。ゼロ知識証明(ZKP)を使って、Ethereumのブロックチェーンがより効率的に取引を処理できるようにしてる。この技術のおかげで、複数の取引を同時に処理できるから、取引コストを抑えて、もっと多くのユーザーが参加しやすくなるんだ。
2024年7月時点で、ZKsync EraはトップクラスのL2ソリューションの一つで、数十億ドルがそのエコシステムにロックされている。ZKsyncのようなロールアップは、Ethereumのスケーリングにとって重要で、新しい能力を導入し、多くのユーザーを引き寄せてる。でも、まだ答えが必要な疑問もあるし、この分野の研究は限られてるんだ。
L2ソリューションの重要性が高まる中、私たちのデータセットは研究者がZKsyncをもっと詳しく研究する手助けをすることを目指してる。このデータへのアクセスを提供することで、ZKsyncやL2ソリューションに関するさらなる研究を促進できればと思ってるよ。
ZKsyncデータの入手可能性
研究をサポートするために、私たちのZKsyncデータセットをGitHubリポジトリで公開したよ。このデータセットには、ブロック、取引、レシート、ログに関する1年分の情報が含まれてる。データセットの詳細はリポジトリで確認できるよ。
研究と分析のサポート
私たちのデータセットには、研究者やユーザーが利用できる可能性のあるアプリケーションが含まれてる。例えば、取引手数料やガスの使用状況、取引によってトリガーされるイベント、トークンスワップなどに関する研究を助けることができるんだ。
RPCや外部サービスからデータを集めるのは多くの場合、時間がかかって高額になることがあることを理解してる。だから、私たちはZKsyncデータセットを簡単にダウンロードして使えるようにしたし、研究者がデータを処理・分析するためのサンプルコードも提供したよ。これによって再現性が可能になり、他の人が私たちの結果を検証できるようになるんだ。
論文の構成
この記事は、データセットの理解を深めるために構成されてるよ。セクションは以下の通り:
- データセットの詳細と作成方法について。
- 実施できる分析の例。
- データ収集の課題とその解決策。
- このデータセットを使って探求できる今後の研究の方向性。
データセットの詳細
私たちのZKsyncデータセットは、2023年2月14日から2024年3月24日までの期間をカバーしてる。300万件以上の取引と約160万の契約がこの期間に展開されてる。このデータセットは、ZKsyncのローンチ以来の活動の包括的な概要を提供するよ。
データは、私たちのZKsync Eraアーカイブノードから収集された。最初は生データだったけど、プレプロセス段階でパーケット形式にフォーマットした。この形式にすることで、Pythonの人気ライブラリ(PandasやPolarsなど)を使って簡単にアクセスできるようになった。膨大な量のデータがあるから、より良いパフォーマンスやメモリ管理のためにPolarsを使用したんだ。
ブロックチェーンの構造
ZKsyncデータを理解するためには、ブロックと取引がブロックチェーン内でどう相互作用するかを把握することが重要だ。
ブロック
ブロックはブロックチェーン内のデータの塊で、それぞれユニークなハッシュで識別される。取引情報やメタデータが含まれてる。ブロックはチェーンでリンクされていて、取引が安全に行われ、コンセンサスが達成され、データが効率的に処理される。
取引
取引はブロックチェーン上でのアクションを表すもので、資産の移転や契約の実行などが含まれる。各取引はユーザーによって開始され、ノードのネットワークによって検証される。検証が終わると、取引はブロックにまとめられる。ZKsyncは取引を集約してメインのブロックチェーンの外で処理し、コストを抑え、ネットワークの負担を軽減してる。
取引には、受取人のアドレス、金額、ガス価格、ガスリミットなどの詳細が含まれてる。ガスはユーザーが取引を処理するために支払う手数料を表してる。ブロック番号で取引をソートすることで、ブロックチェーン内の秩序を保つことができるんだ。
レシート
取引のレシートは、処理が完了した後の各取引の結果をまとめたものだ。取引ハッシュ、ブロック番号、使用されたガス、発生したコストなどの詳細が含まれてる。この情報は、スマートコントラクトとのインタラクションを理解するためにユーザーや開発者にとって重要なんだ。
ログ
取引ログは、特にスマートコントラクトに関連する取引中にトリガーされたイベントの記録だ。これらはトークンの移転や承認など、さまざまな活動を追跡するのに役立つ。これらのログは、ブロックチェーン分析を支援し、ネットワーク上のユーザー行動を理解するために重要だよ。
例分析
私たちのデータセットを使えば、研究者が行える多くの分析がある。データセット内の各種データがZKsyncでの活動に関する洞察を提供することができるんだ。
ガス使用量と取引手数料
分析の中で重要なエリアの一つは、取引、ガス使用量、手数料を見ることだ。ZKsyncで実行された日々の取引を調べることで、活動のトレンドやスパイクを確認できる。例えば、調査期間中、ネットワークは平均して約90万件の取引を日々行っていて、特定のイベントでは顕著な急増が見られた。
ガス使用量は変動があり、これを研究することでネットワークがどれだけ効率的に機能しているかを理解できる。分析によって、ガス使用量のスパイクがエアドロップや高取引活動に関連していることがわかるかもしれない。
イベントと契約の展開
スマートコントラクトから発せられるイベントは、ネットワーク活動に関する追加データを提供してくれる。主要なイベントタイプを分析すると、Transferイベントが大部分を占めることがわかる。これらのイベントを理解することで、ネットワーク内でトークンがどのくらい移動しているかを把握できる。
契約の展開もネットワークの成長や活動レベルを示すものだ。日々の契約展開数を観察することで、開発者の関心やZKsyncエコシステム全体の健康状態を知ることができる。
スワップイベント
スワップイベントは、特に分散型取引所(DEX)にとって重要だ。スワップイベントの数を時間ごとに見ることで、取引活動のレベルや市場の動向を観察できる。どの契約がスワップに関与しているかを分析すれば、人気の取引ペアや市場のダイナミクスを特定できる。
ユーザー行動分析
ユーザー行動を分析することは、ZKsyncエコシステムのダイナミクスを理解するために重要だ。ユーザーごとの取引数を調べることで、エアドロップファーマーや使用パターンといったトレンドを特定できる。このデータからソーシャルメディアがブロックチェーン活動に与える影響についても洞察を得ることができる。
今後の研究の方向性
私たちのデータセットは、さまざまな研究の道を開いてくれるよ。ここにいくつかの研究者がこの情報から得られる可能性のある領域を示すね。
MEVとアービトラージ
最小抽出可能価値(MEV)やアービトラージは、ブロックチェーン経済学の重要な概念だ。Layer 1チェーンでの研究は行われているけど、ZKsyncのようなL2システムに関する研究はまだ比較的新しい。私たちのデータセットは、バックラン戦略や集中型取引所とDEXプラットフォーム間のアービトラージ機会を調査する手助けになるかもしれない。
ユーザー活動分析
ZKsyncでのユーザー行動を理解することは、貴重な洞察をもたらすよ。研究者は、スマートコントラクトとのユーザーインタラクションを探索し、エアドロップや他のインセンティブから利益を得るために複数のアカウントを作るシビル攻撃のトレンドを特定できるかもしれない。この分析は、組織がユーザーエンゲージメントを理解し、誤解を招く行為に対抗する戦略を開発するのに役立つ。
データサイエンスと分析
私たちのデータセットは、データ分析や科学に興味がある人にとって素晴らしいリソースだ。データサイエンティストは、この情報を公的なプラットフォームで活用してスキルを向上させたり、能力をアピールしたりできる。このデータセットは、ブロックチェーン業界に足を踏み入れようとしている人にとって、教育的なツールとしても価値があるよ。
結論
まとめると、ブロックチェーン技術は透明性や非中央集権に関して利点があるけど、ブロックチェーンデータにアクセスしたり、それを活用したりするのにはまだ課題がある。私たちがZKsyncデータセットを公開する取り組みは、これらの課題に対処し、研究者や愛好者がブロックチェーンの世界に踏み込むのを簡単にすることを目指してるんだ。
1年間のZKsyncデータを提供することで、L2システムに関する研究環境を豊かにし、ZKsyncの可能性に対する関心を高めたいと思ってる。このデータセットは既存の研究に貢献するだけでなく、技術的な専門知識に関わらず多くのユーザーにアクセス可能であることを目指してる。
この取り組みを通じて、貴重な洞察が生まれ、ブロックチェーンのダイナミクスへの理解が深まり、このエキサイティングな分野でさらなる革新が促進されると信じてるよ。
タイトル: A Public Dataset For the ZKsync Rollup
概要: Despite blockchain data being publicly available, practical challenges and high costs often hinder its effective use by researchers, thus limiting data-driven research and exploration in the blockchain space. This is especially true when it comes to Layer~2 (L2) ecosystems, and ZKsync, in particular. To address these issues, we have curated a dataset from 1 year of activity extracted from a ZKsync Era archive node and made it freely available to external parties. In this paper, we provide details on this dataset and how it was created, showcase a few example analyses that can be performed with it, and discuss some future research directions. We also publish and share the code used in our analysis on GitHub to promote reproducibility and to support further research.
著者: Maria Inês Silva, Johnnatan Messias, Benjamin Livshits
最終更新: 2024-07-26 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2407.18699
ソースPDF: https://arxiv.org/pdf/2407.18699
ライセンス: https://creativecommons.org/licenses/by/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://github.com/matter-labs/zksync-data-dump/blob/main/notebooks/01-zksync-data.ipynb
- https://github.com/matter-labs/zksync-data-dump/blob/main/notebooks/02-data-exploration-fees.ipynb
- https://github.com/matter-labs/zksync-data-dump/blob/main/notebooks/03-data-exploration-contracts.ipynb
- https://github.com/matter-labs/zksync-data-dump/blob/main/notebooks/04-data-exploration-swaps.ipynb
- https://github.com/matter-labs/zksync-data-dump
- https://github.com/matter-labs/zksync-data-dump/tree/main/notebooks
- https://era.zksync.network/address/0x0000000000000000000000000000000000008001