2020年選挙の投票記録を理解すること
投票記録の重要性とその影響についての考察。
Shiro Kuriwaki, Mason Reece, Samuel Baltz, Aleksandra Conevska, Joseph R. Loffredo, Can Mutlu, Taran Samarth, Kevin E. Acevedo Jetter, Zachary Djanogly Garai, Kate Murray, Shigeo Hirano, Jeffrey B. Lewis, James M. Snyder, Charles H. Stewart
― 1 分で読む
目次
投票用紙は選挙の要だよ。誰が誰に投票したのかを示して、民主主義をスムーズに運営するのに役立つんだ。2020年のアメリカの選挙の後、いくつかの場所で電子投票記録が公開されて、実際に投じられた票を見ることができるようになったんだ。これを「投票記録(CVR)」って呼ぶんだけど、どこも同じように公開したわけじゃなくて、結果を理解しようとする人たちには混乱が生じていたんだ。
そこで私たちは、2020年のアメリカの一般選挙のCVRのデータベースを作ることにしたんだ。複数の州から公開されている記録を集めて、標準化して、公式の認定選挙結果と照らし合わせたんだ。私たちのデータベースには、大統領、知事、アメリカ合衆国上院、下院、州議会選挙の投票が含まれていて、約4270万人の票をカバーしているんだ、20州の分ね。
このデータベースは、投票方法や選挙の運営を理解したい人にとって便利なリソースだよ。このデータを使って、重要な州では、約1.9%の堅固な共和党員が党を超えてジョー・バイデンに投票し、約1.2%の忠実な民主党員がドナルド・トランプに投票したことがわかったんだ。
投票記録って何?
投票用紙を考えるとき、通常は投票者が記入した物理的な紙を思い浮かべるよね。でも、今の時代、これらの投票の電子記録もあるんだ。投票記録(CVR)っていうこれらの電子記録は、投票者が票で選んだ選択を示すんだ。米国標準技術局は、CVRを「投票者がどのように投票したかを記録する電子記録」と説明しているよ。
CVRは選挙結果の全てではないけど、票の検証や集計に重要な役割を果たしているんだ。CVRは個々の選択を分けて表示するから、分析にとってとても役に立つんだ。
私たちの調査では、約4270万人の投票者のCVRデータを集めたよ。このデータセットはオンラインで見つけられるよ。公式な選挙結果は通常簡単に見つけられるけど、CVRは州レベルで収集されることはあまりないんだ。通常は地方の選挙管理者が管理しているからね。
2020年の選挙後、地方の選挙管理者から投票記録のリクエストが急増したんだ。いくつかの州では、2020年から2022年にかけてこれらの記録のリクエストが4倍から5倍になったよ。この需要に応えるために地方の役人が頑張ったおかげで、研究者たちはたくさんのCVRにアクセスできるようになったんだ。
CVRが重要な理由
CVRデータセットは色々な理由で重要なんだ。政治学者や経済学者、社会学者にとって、このデータは投票パターンの詳細な研究を可能にするんだ。研究者はCVRで個々の票を追跡できるから、調査や集計データよりも投票行動をより正確に測定できるんだ。
例えば、トランプに投票した人がどれくらい共和党の候補に投票しているかを知ることができるし、CVRを使えば候補者による投票のニュアンスを分析できる。特に、あまり注目されない州議会選挙についてもね。
チケット分割
「チケット分割」って現象があって、これは有権者が異なる党の候補者を異なる役職に選ぶときに起こるんだ。例えば、バイデンを大統領に選んだけど他の役職にはいくつかの共和党員に投票する人もいる。集計データはトランプがどれだけの票を得たかを教えてくれるけど、チケット分割の詳細を示すことはできない。CVRはその行動を明確に示してくれるんだ。
このデータを分析することで、民主党の候補者を支持しつつ、進歩的な施策にも賛成する有権者がどれくらいかを調べることもできる。CVRデータは、有権者の地理的な位置の情報も含んでいるから、どの地区にチケット分割の有権者が多いかも洞察できるんだ。
もう一つ面白いのは、チケット分割がその地域でのメディアの種類や年齢、民族、収入といった人口統計の変数とどう関連しているかを探索することだよ。
CVRの他の使い方
CVRはチケット分割を理解するためだけじゃなく、さまざまなことに役立つんだ。例えば、研究者が順位選択投票を調べたり、特定のレースをスキップする「ロールオフ」を見ることができるし、マイナー政党への支持分析もできる。データセットにはマイナー政党候補に投票した人々の記録がたくさん含まれていて、これはサンプルサイズの制約から多くの調査で捉えるのが難しいんだ。
その一方で、選挙の弁護士や役人はCVRを利用して選挙の透明性を研究することができるんだ。票のカウント方法についての公共の関心はシステムに対する疑念を生む可能性がある。投票レベルのデータは、驚くべき選挙結果を明らかにするのに役立ち、透明性と有権者のプライバシーのバランスを取るための議論に貢献するんだ。
大きな絵
2020年11月の出来事は、アメリカの政治の運営方法を変えたんだ。選挙管理はホットボタンの問題になったよ。今後の選挙も同じように scrutinized されるかもしれなくて、選挙管理者、データ科学者、社会科学者の間での明確さと協力がこれまで以上に重要になっているんだ。
アメリカの3143の郡の中で、私たちのプロジェクトは464の郡と3つの州全体のデータセットに焦点を当てたんだ。CVRデータは、ウィスコンシンやジョージアのような接戦地区、しっかりとした民主党や共和党の州を含むいくつかの州から引き出されているよ。
データの掘り下げ
私たちは、収集したCVRの標準化と検証のためにいくつかのステップを踏んだんだ。まず、CVRファイルをダウンロードして、異なる管轄区域間で比較可能であることを確認したよ。CVRフォーマットは郡ごとに使用される投票機の種類によって異なることがよくあるから、データをきれいにする必要があったんだ。
次に、各投票者にCVRに基づいてユニークな識別子を割り当てたよ。ほとんどの場合、各投票者にはすべての選択に対して1つの識別子が付与されたんだ。いくつかの郡では投票用紙が両面だったため、各投票者の選択が一緒に保たれるようにページを合わせる必要もあったよ。
その後、公式データとCVRを照らし合わせて不一致を特定したんだ。私たちは分析を6つのレースに限定したんだ:大統領、知事、アメリカ合衆国上院、アメリカ合衆国下院、州上院、州下院。CVRと公式結果の間に1%未満の差のある郡だけが公開されたんだ。
データセットの内訳
私たちのデータセットはかなりのもので、166百万以上の行が含まれているよ。各行は特定の選挙に対して投票者がした選択を示しているんだ。私たちは命名規則に従って一貫性を保つようにしたよ。データセットには、選択なしの「アンダーボート」や許可された選択肢以上の「オーバーボート」など、さまざまなタイプの票が含まれているんだ。
データを準備する際にプライバシーの問題も考慮したよ。特定の投票者の選択を特定できる形で明らかにしないように気をつけたんだ。例えば、特定の地区であまりにも少ない票が投じられた場合、匿名性を守るために他の地区とデータを組み合わせたんだ。
地理的なカバレッジ
私たちのデータベースには20州が含まれていて、各郡のデータが分析可能だよ。ただし、全ての州の全ての郡が含まれているわけではないんだ。このデータセットは、アメリカ全体の人口に対する人口統計の比較を通じて、有権者の傾向や特徴のスナップショットを提供しているよ。
データの検証
私たちのCVRが正確であることを保証するために、郡と小選挙区の両方で徹底的な検証を行ったんだ。私たちは、CVRからの票の合計を公式な情報と比較したよ。
不一致を見つけた場合、その理由を調べたんだ。時には、CVRからは全く小選挙区が抜けていたり、特定の投票方法が含まれていなかったりすることもあった。いくつかのケースでは、郡が秘密投票を保護するために特定の投票選択を削除しなければならなかったこともあったんだ。
データから学ぶ
私たちはデータセットを使って作業するためのいくつかのガイダンスも提供したよ。ユーザーはRやPythonのようなプログラミング言語を使ってデータを読み込むことができるんだ。このデータセットは、迅速に要約を生成できるように構造化されているよ。
例えば、研究者はトランプを選んだ共和党員の数や、バイデンに投票した民主党員の数を調べることで党への忠誠を探ることができるんだ。州や郡に基づいてデータをフィルタリングすることで、ユーザーはさまざまな分析を自由に行うことができるよ。
結論
2020年のアメリカの選挙からの投票記録は、政治学や選挙管理における研究や分析への扉を開いたんだ。このデータセットを使うことで、以前は難しかった、あるいは不可能だった方法で投票パターンや行動を明らかにできるんだ。
これから先、これらの記録が示すトレンドやその意味を理解することは、選挙プロセスへの信頼を確保するために重要なんだ。選挙の透明性への関心が続く中、私たちのCVRに関する作業は今後の研究のための強固な基盤を提供するんだ。
だから、虫眼鏡を持って、数字に飛び込もう!
タイトル: Cast vote records: A database of ballots from the 2020 U.S. Election
概要: Ballots are the core records of elections. Electronic records of actual ballots cast (cast vote records) are available to the public in some jurisdictions. However, they have been released in a variety of formats and have not been independently evaluated. Here we introduce a database of cast vote records from the 2020 U.S. general election. We downloaded publicly available unstandardized cast vote records, standardized them into a multi-state database, and extensively compared their totals to certified election results. Our release includes vote records for President, Governor, U.S. Senate and House, and state upper and lower chambers -- covering 42.7 million voters in 20 states who voted for more than 2,204 candidates. This database serves as a uniquely granular administrative dataset for studying voting behavior and election administration. Using this data, we show that in battleground states, 1.9 percent of solid Republicans (as defined by their congressional and state legislative voting) in our database split their ticket for Joe Biden, while 1.2 percent of solid Democrats split their ticket for Donald Trump.
著者: Shiro Kuriwaki, Mason Reece, Samuel Baltz, Aleksandra Conevska, Joseph R. Loffredo, Can Mutlu, Taran Samarth, Kevin E. Acevedo Jetter, Zachary Djanogly Garai, Kate Murray, Shigeo Hirano, Jeffrey B. Lewis, James M. Snyder, Charles H. Stewart
最終更新: 2024-10-24 00:00:00
言語: English
ソースURL: https://arxiv.org/abs/2411.05020
ソースPDF: https://arxiv.org/pdf/2411.05020
ライセンス: https://creativecommons.org/licenses/by-sa/4.0/
変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。
オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。
参照リンク
- https://doi.org/10.7910/DVN/PQQ3KV
- https://verifiedvoting.org/verifier
- https://github.com/kuriwaki/cvr_harvard-mit_scripts/issues
- https://bit.ly/46eISNX
- https://r4ds.hadley.nz/arrow
- https://arrow.apache.org/docs/python/parquet.html
- https://github.com/kuriwaki/cvr_harvard-mit_scripts
- https://github.com/kuriwaki/dominionCVR
- https://github.com/kuriwaki/cvr_harvard-mit_scripts/tree/main/code/01_build-returns/code
- https://ballotpedia.org/Georgia
- https://bit.ly/3RYhL3A