Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Statistik# Computer und Gesellschaft# Anwendungen

Verstehen von Cast Vote Records aus der Wahl 2020

Ein Blick auf die Bedeutung von Abstimmungsprotokollen und ihren Einfluss.

Shiro Kuriwaki, Mason Reece, Samuel Baltz, Aleksandra Conevska, Joseph R. Loffredo, Can Mutlu, Taran Samarth, Kevin E. Acevedo Jetter, Zachary Djanogly Garai, Kate Murray, Shigeo Hirano, Jeffrey B. Lewis, James M. Snyder, Charles H. Stewart

― 8 min Lesedauer


Untersuchung derUntersuchung derWahldaten von 2020Wahlintegrität.Einblicke in Wahltrends und
Inhaltsverzeichnis

Stimmzettel sind das Rückgrat jeder Wahl. Sie zeigen uns, wer für wen gestimmt hat, und helfen, unsere Demokratie am Laufen zu halten. Nach der US-Wahl 2020 haben einige Orte ihre elektronischen Wahlunterlagen geöffnet, sodass Leute die tatsächlich abgegebenen Stimmen sehen konnten. Diese Unterlagen werden als abgegebene Stimmenunterlagen (CVRs) bezeichnet. Allerdings haben nicht alle Orte diese Aufzeichnungen gleich veröffentlicht, was für etwas Chaos sorgte, wenn man die Ergebnisse nachvollziehen wollte.

Wir haben uns der Herausforderung gestellt und eine Datenbank mit CVRs aus der US-Wahl 2020 erstellt. Wir haben öffentlich verfügbare Aufzeichnungen aus mehreren Bundesstaaten gesammelt, sie standardisiert und sichergestellt, dass sie mit den offiziell zertifizierten Wahlergebnissen übereinstimmen. Unsere Datenbank umfasst Stimmen für Präsident, Gouverneur, US-Senat und den Kongress sowie staatliche Legislaturwahlen – insgesamt etwa 42,7 Millionen Stimmen aus 20 Bundesstaaten.

Diese Datenbank ist eine praktische Ressource für alle, die verstehen wollen, wie die Leute abgestimmt haben und wie die Wahlen abliefen. Mit diesen Daten haben wir herausgefunden, dass in wichtigen Bundesstaaten etwa 1,9 % der treuen Republikaner über die Parteilinien hinweg für Joe Biden stimmten und etwa 1,2 % der loyalen Demokraten für Donald Trump.

Was sind abgegebene Stimmenunterlagen?

Wenn wir an Stimmzettel denken, stellen wir uns normalerweise das physische Stück Papier vor, das von den Wählern ausgefüllt wird. Aber in der heutigen Welt haben wir auch elektronische Aufzeichnungen dieser Stimmen. Diese elektronischen Aufzeichnungen, bekannt als abgegebene Stimmenunterlagen (CVRs), zeigen die Entscheidungen der Wähler auf ihren Stimmzetteln. Das National Institute of Standards and Technology beschreibt CVRs als elektronische Aufzeichnungen, die festhalten, wie ein Wähler abgestimmt hat.

Obwohl CVRs nicht das Mass aller Dinge für Wahlergebnisse sind, spielen sie eine entscheidende Rolle bei der Überprüfung und Auszählung der Stimmen. Da CVRs die Stimmen nach individuellen Entscheidungen aufschlüsseln, sind sie super für Analysen geeignet.

In unserer Studie haben wir Daten von CVRs gesammelt, die etwa 42,7 Millionen Wähler abdeckten. Diese Datensätze findet man online. Im Gegensatz zu den zertifizierten Wahlergebnissen, die normalerweise leicht zu finden sind, werden CVRs nicht oft auf Landesebene gesammelt. Stattdessen werden sie typischerweise von lokalen Wahlbehörden aufbewahrt.

Nach der Wahl 2020 gab es einen grossen Anstieg der Anfragen nach Wählerunterlagen von den lokalen Beamten. In einigen Bundesstaaten haben sich die Anfragen für diese Unterlagen zwischen 2020 und 2022 vier- bis fünffach erhöht. Dank der harten Arbeit der Beamten, die auf diese Anforderungen reagierten und die Unterlagen verfügbar machten, haben Forscher jetzt Zugang zu einem Schatz an CVRs.

Warum CVRs wichtig sind

Der CVR-Datensatz ist aus verschiedenen Gründen wichtig. Für Politikwissenschaftler, Ökonomen und Soziologen ermöglicht diese Daten eine detaillierte Untersuchung von Abstimmungsmustern. Forscher können das Abstimmungsverhalten viel genauer messen als mit Umfragen oder aggregierten Wahldaten, da CVRs individuelle Stimmen verfolgen.

Zum Beispiel kann man sehen, wie viele Leute, die für Trump als Präsident gestimmt haben, auch für republikanische Kandidaten auf ihren Stimmzetteln weiter unten gestimmt haben. Ausserdem ermöglichen CVRs den Forschern, die Nuancen zu analysieren, wie Menschen in verschiedenen Wahlen abstimmen, einschliesslich staatlicher Legislaturwahlen, die oft übersehen werden.

Ticket-Splitting

Ein Phänomen, das man Ticket-Splitting nennt, passiert, wenn Wähler Kandidaten aus verschiedenen Parteien für unterschiedliche Ämter wählen. Zum Beispiel könnten einige Wähler Biden für Präsident wählen, aber für mehrere Republikaner bei anderen Ämtern stimmen. Aggregierte Daten können dir sagen, wie viele Stimmen Trump erhalten hat, aber sie können nicht die Details des Ticket-Splitting-Verhaltens zeigen. CVRs geben den Forschern ein klares Bild dieses Verhaltens.

Durch die Analyse dieser Daten können Forscher auch herausfinden, wie viele Wähler demokratische Kandidaten unterstützt haben, während sie auch progressive Massnahmen auf ihren Stimmzetteln unterstützten. Die CVR-Daten enthalten Informationen über die geografischen Standorte der Wähler, was Einblicke darüber gibt, in welchen Wahlkreisen es mehr Wähler mit Ticket-Splitting gibt.

Ein weiteres interessantes Gebiet, das man erkunden kann, ist, wie Ticket-Splitting mit den Arten von Medien zusammenhängt, die in einem Gebiet verfügbar sind, oder sogar mit demografischen Variablen wie Alter, Rasse und Einkommen.

Andere Möglichkeiten, CVRs zu nutzen

CVRs sind nützlich für mehr als nur das Verständnis von Ticket-Splitting. Sie ermöglichen es Forschern zum Beispiel, die Rangwahl zu untersuchen, Fälle von Roll-Off (wenn Wähler bestimmte Wahlen auslassen) zu betrachten und die Unterstützung für kleinere Parteien zu analysieren. Der Datensatz enthält zahlreiche Aufzeichnungen über Personen, die für Kandidaten kleinerer Parteien gestimmt haben, was in den meisten Umfragen aufgrund von Stichprobengrössenbeschränkungen schwer zu erfassen ist.

Auf der anderen Seite können Wahlrechtler und Beamte CVRs nutzen, um die Wahlintegrität zu studieren. Öffentliche Bedenken darüber, wie Stimmen gezählt werden, können zu Zweifeln am System führen. Daten auf Stimmzettel-Ebene können dazu beitragen, überraschende Wahlergebnisse zu klären und Diskussionen über den Ausgleich von Transparenz und dem Datenschutz der Wähler zu fördern.

Das grössere Ganze

Die Ereignisse vom November 2020 haben die Art und Weise, wie Politik in den USA funktioniert, verändert. Die Wahlverwaltung ist zu einem heissen Thema geworden. Zukünftige Wahlen könnten ähnlich hinterfragt werden, und die Notwendigkeit von Klarheit und Zusammenarbeit zwischen Wahlbeamten, Datenwissenschaftlern und Sozialwissenschaftlern ist wichtiger denn je.

Von den 3.143 Landkreisen in den USA konzentrierte sich unser Projekt auf 464 Landkreise und drei landesweite Datensätze. Die CVR-Daten stammen aus mehreren Bundesstaaten, darunter umkämpfte Gebiete wie Wisconsin und Georgia sowie fest demokratische und republikanische Staaten.

Datenanalyse

Wir haben mehrere Schritte unternommen, um die gesammelten CVRs zu standardisieren und zu validieren. Zuerst luden wir die CVR-Dateien herunter und stellten sicher, dass sie zwischen verschiedenen Jurisdiktionen vergleichbar waren. Die Formate der CVRs variieren oft je nach Art der in jedem Landkreis verwendeten Wahlmaschine, sodass wir die Daten bereinigen mussten.

Dann vergaben wir eindeutige Identifikatoren für jeden Wähler basierend auf ihrer CVR. In den meisten Fällen erhielt jeder Wähler einen Identifikator für alle ihre Entscheidungen. In einigen Landkreisen, wo die Stimmzettel doppelseitig waren, mussten wir die Seiten abgleichen, um sicherzustellen, dass die Entscheidungen jedes Wählers zusammengehalten wurden.

Anschliessend überprüften wir die CVRs mit offiziellen Daten, um Abweichungen zu identifizieren. Wir beschränkten unsere Analyse auf sechs Rennen: Präsident, Gouverneur, US-Senat, US-Repräsentantenhaus, Landessenat und Landtag. Nur Landkreise mit weniger als 1 % Unterschied zwischen unseren CVRs und den offiziellen Ergebnissen wurden veröffentlicht.

Der Datensatz im Detail

Unser Datensatz ist ziemlich umfangreich und enthält über 166 Millionen Zeilen. Jede Zeile gibt eine Entscheidung an, die ein Wähler für einen bestimmten Wettbewerb getroffen hat. Wir haben Namenskonventionen befolgt, um Konsistenz zu wahren. Der Datensatz umfasst verschiedene Arten von Stimmen, wie Unterstimmen (keine Wahl) und Überstimmen (mehr Wahlentscheidungen als erlaubt).

Wir haben auch Datenschutzprobleme berücksichtigt, während wir die Daten vorbereiteten. Wir haben darauf geachtet, keine spezifischen Wählerentscheidungen offenzulegen, die auf individuelle Wähler zurückverfolgt werden könnten. Zum Beispiel, wenn zu wenige Stimmen in einem bestimmten Bezirk abgegeben wurden, haben wir die Daten mit anderen Bezirken kombiniert, um die Anonymität zu schützen.

Geografische Abdeckung

Unsere Datenbank umfasst 20 Bundesstaaten. Die Daten jedes einbezogenen Landkreises sind für Analysen verfügbar. Allerdings ist nicht jeder Landkreis in jedem Bundesstaat vertreten. Der Datensatz bietet einen Überblick über Wählertrends und -merkmale, mit demografischen Vergleichen zur Gesamtbevölkerung der USA.

Validierung der Daten

Um sicherzustellen, dass unsere CVRs genau waren, führten wir gründliche Validierungen sowohl auf Landkreis- als auch auf Bezirksebene durch. Wir verglichen die Stimmenzahlen aus unseren CVRs mit denen, die von offiziellen Quellen gemeldet wurden.

Wenn wir Abweichungen fanden, schauten wir uns die Gründe dafür an. Manchmal fehlten ganze Bezirke in den CVRs oder bestimmte Abstimmungsmethoden wurden nicht aufgenommen. In einigen Fällen mussten Landkreise bestimmte Wahlentscheidungen schwärzen, um das geheime Abstimmen zu schützen.

Lernen aus den Daten

Wir haben auch einige Hinweise gegeben, wie man mit dem Datensatz arbeitet. Benutzer können die Daten mithilfe von Programmiersprachen wie R oder Python einlesen. Der Datensatz ist so strukturiert, dass man schnell Zusammenfassungen erstellen kann.

Zum Beispiel können Forscher die Parteitreue erkunden, indem sie schauen, wie viele republikanische Wähler für Trump und wie viele Demokraten für Biden gestimmt haben. Durch die Filterung der Daten nach Bundesstaat und Landkreis können Benutzer verschiedene Analysen unabhängig durchführen.

Fazit

Die abgegebenen Stimmenunterlagen der US-Wahl 2020 haben eine Tür für Forschung und Analyse in der Politikwissenschaft und Wahlverwaltung geöffnet. Mit diesem Datensatz können wir Abstimmungsmuster und -verhalten aufdecken, wie es zuvor schwierig oder sogar unmöglich war.

Während wir voranschreiten, wird es entscheidend sein, die Auswirkungen dieser Unterlagen und die Trends, die sie aufzeigen, zu verstehen, um das Vertrauen in den Wahlprozess zu gewährleisten. Angesichts des anhaltenden Interesses an Wahlintegrität bietet unsere Arbeit mit CVRs eine solide Grundlage für zukünftige Forschungen.

Also schnapp dir deine Lupe und lass uns in die Zahlen eintauchen!

Originalquelle

Titel: Cast vote records: A database of ballots from the 2020 U.S. Election

Zusammenfassung: Ballots are the core records of elections. Electronic records of actual ballots cast (cast vote records) are available to the public in some jurisdictions. However, they have been released in a variety of formats and have not been independently evaluated. Here we introduce a database of cast vote records from the 2020 U.S. general election. We downloaded publicly available unstandardized cast vote records, standardized them into a multi-state database, and extensively compared their totals to certified election results. Our release includes vote records for President, Governor, U.S. Senate and House, and state upper and lower chambers -- covering 42.7 million voters in 20 states who voted for more than 2,204 candidates. This database serves as a uniquely granular administrative dataset for studying voting behavior and election administration. Using this data, we show that in battleground states, 1.9 percent of solid Republicans (as defined by their congressional and state legislative voting) in our database split their ticket for Joe Biden, while 1.2 percent of solid Democrats split their ticket for Donald Trump.

Autoren: Shiro Kuriwaki, Mason Reece, Samuel Baltz, Aleksandra Conevska, Joseph R. Loffredo, Can Mutlu, Taran Samarth, Kevin E. Acevedo Jetter, Zachary Djanogly Garai, Kate Murray, Shigeo Hirano, Jeffrey B. Lewis, James M. Snyder, Charles H. Stewart

Letzte Aktualisierung: 2024-10-24 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2411.05020

Quell-PDF: https://arxiv.org/pdf/2411.05020

Lizenz: https://creativecommons.org/licenses/by-sa/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Ähnliche Artikel