Entendiendo los Registros de Votación del 2020
Una mirada a la importancia de los registros de votos emitidos y su impacto.
Shiro Kuriwaki, Mason Reece, Samuel Baltz, Aleksandra Conevska, Joseph R. Loffredo, Can Mutlu, Taran Samarth, Kevin E. Acevedo Jetter, Zachary Djanogly Garai, Kate Murray, Shigeo Hirano, Jeffrey B. Lewis, James M. Snyder, Charles H. Stewart
― 9 minilectura
Tabla de contenidos
- ¿Qué Son los Registros de Votos Emitidos?
- Por Qué Son Importantes los CVRs
- División de Boletas
- Otras Formas de Usar los CVRs
- El Panorama General
- Profundizando en los Datos
- Desglose del Conjunto de Datos
- Cobertura Geográfica
- Validando los Datos
- Aprendiendo de los Datos
- Conclusión
- Fuente original
- Enlaces de referencia
Las boletas son la columna vertebral de cualquier elección. Nos dicen quién votó por quién, y ayudan a que nuestra democracia funcione sin problemas. Después de las elecciones de EE. UU. en 2020, algunos lugares abrieron sus registros de votos electrónicos, permitiendo que la gente viera los votos reales emitidos. Estos registros se conocen como registros de votos emitidos (CVRs). Sin embargo, no todos los lugares publicaron estos registros de la misma manera, lo que generó un poco de caos para cualquiera que intentara entender los resultados.
Decidimos asumir el reto creando una base de datos de CVRs de las elecciones generales de EE. UU. de 2020. Reunimos registros disponibles públicamente de varios estados, los estandarizamos y nos aseguramos de que coincidieran con los resultados oficiales certificados. Nuestra base de datos incluye votos para Presidente, Gobernador, Senado de EE. UU. y Cámara de Representantes, además de las contiendas legislativas estatales, cubriendo votos de aproximadamente 42,7 millones de personas en 20 estados.
Esta base de datos es un recurso útil para cualquiera que quiera entender cómo votó la gente y cómo se llevaron a cabo las elecciones. Con estos datos, descubrimos que en estados clave, alrededor del 1,9% de los republicanos sólidos cruzaron líneas de partido para votar por Joe Biden, y alrededor del 1,2% de los demócratas leales optaron por Donald Trump.
¿Qué Son los Registros de Votos Emitidos?
Cuando pensamos en boletas, generalmente pensamos en el papel físico que llenan los votantes. Sin embargo, en el mundo de hoy, también tenemos registros electrónicos de esos votos. Estos registros electrónicos, conocidos como registros de votos emitidos (CVRs), muestran las elecciones que hicieron los votantes en sus boletas. El Instituto Nacional de Estándares y Tecnología describe los CVRs como registros electrónicos que capturan cómo votó un votante.
Aunque los CVRs no son la única fuente de resultados electorales, juegan un papel crucial en la verificación y el conteo de votos. Como los CVRs desglosan los votos por elección individual, son geniales para el análisis.
En nuestro estudio, recopilamos datos de los CVRs que representaban alrededor de 42,7 millones de votantes. Puedes encontrar este conjunto de datos en línea. A diferencia de los resultados electorales certificados, que suelen ser fáciles de encontrar, los CVRs no suelen recopilarse a nivel estatal. En cambio, generalmente los mantienen los funcionarios electorales locales.
Después de las elecciones de 2020, hubo un gran aumento en las solicitudes de registros de votos por parte de funcionarios locales. En algunos estados, las solicitudes de estos registros aumentaron de cuatro a cinco veces entre 2020 y 2022. Gracias al arduo trabajo de los funcionarios que respondieron a estas demandas y hicieron que los registros estuvieran disponibles, los investigadores ahora tienen acceso a un tesoro de CVRs.
Por Qué Son Importantes los CVRs
El conjunto de datos de CVR es importante por varias razones. Para los científicos políticos, economistas y sociólogos, estos datos permiten un estudio detallado de los Patrones de votación. Los investigadores pueden medir los comportamientos de voto con mucha más precisión que usando encuestas o datos agregados de elecciones, ya que los CVRs rastrean votos individuales.
Por ejemplo, puedes ver cuántas personas que votaron por Trump para Presidente también votaron por candidatos republicanos más abajo en sus boletas. Además, los CVRs permiten a los investigadores analizar la complejidad de cómo la gente vota en diferentes contiendas, incluyendo las contiendas legislativas estatales que a menudo se pasan por alto.
División de Boletas
Un fenómeno conocido como división de boletas ocurre cuando los votantes eligen candidatos de diferentes partidos para diferentes cargos. Por ejemplo, algunos votantes podrían elegir a Biden para Presidente pero votar por varios republicanos para otros cargos. Los datos agregados pueden decirte cuántos votos recibió Trump, pero no pueden mostrar los detalles del comportamiento de división de boletas. Los CVRs ofrecen a los investigadores una imagen clara de este comportamiento.
Al analizar estos datos, los investigadores también pueden descubrir cuántos votantes apoyaron a candidatos demócratas mientras también respaldaban medidas progresistas en las boletas. Los datos de CVR incluyen información sobre las ubicaciones geográficas de los votantes, lo que permite obtener información sobre qué distritos tienen más votantes de división de boletas.
Otra área interesante para explorar es cómo la división de boletas se relaciona con los tipos de medios disponibles en un área o incluso variables demográficas como edad, raza e ingresos.
Otras Formas de Usar los CVRs
Los CVRs son útiles para más que solo entender la división de boletas. Por ejemplo, permiten a los investigadores examinar la votación por orden de preferencia, observar casos de roll-off (cuando los votantes omiten ciertas contiendas) y analizar el apoyo a partidos minoritarios. El conjunto de datos contiene numerosos registros para individuos que votaron por candidatos de partidos minoritarios, lo cual es difícil de capturar en la mayoría de las encuestas debido a limitaciones del tamaño de muestra.
Por otro lado, los abogados y funcionarios electorales pueden usar los CVRs para estudiar la integridad electoral. La preocupación pública por cómo se cuentan los votos puede generar dudas sobre el sistema. Los datos a nivel de boleta pueden ayudar a aclarar cualquier resultado electoral sorprendente y contribuir a las discusiones sobre cómo equilibrar la transparencia con la privacidad de los votantes.
El Panorama General
Los eventos de noviembre de 2020 cambiaron la forma en que funciona la política en EE. UU. La administración electoral se convirtió en un tema candente. Las futuras elecciones pueden ser examinadas de maneras similares, y la necesidad de claridad y colaboración entre funcionarios electorales, científicos de datos y científicos sociales es más crítica que nunca.
De los 3,143 condados en EE. UU., nuestro proyecto se centró en 464 condados y tres conjuntos de datos estatales. Los datos de CVR provienen de varios estados, incluyendo áreas decisivas como Wisconsin y Georgia, junto con estados sólidamente demócratas y republicanos.
Profundizando en los Datos
Tomamos varios pasos para estandarizar y validar los CVRs que recopilamos. Primero, descargamos los archivos de CVR y aseguramos que fueran comparables entre diferentes jurisdicciones. Los formatos de CVR a menudo varían según el tipo de máquina de votación utilizada en cada condado, así que tuvimos que limpiar los datos.
Luego, asignamos identificadores únicos a cada votante basado en su CVR. En la mayoría de los casos, cada votante recibió un identificador para todas sus elecciones. En algunos condados donde las boletas eran de doble cara, tuvimos que emparejar las páginas para asegurarnos de que las elecciones de cada votante se mantuvieran juntas.
Después, verificamos los CVRs contra los datos oficiales para identificar discrepancias. Limitamos nuestro análisis a seis contiendas: Presidente, Gobernador, Senado de EE. UU., Cámara de EE. UU., Senado Estatal y Cámara Estatal. Solo se publicaron los condados con una diferencia de menos del 1% entre nuestros CVRs y los resultados oficiales.
Desglose del Conjunto de Datos
Nuestro conjunto de datos es bastante grande, contiene más de 166 millones de filas. Cada fila indica una elección hecha por un votante para un concurso específico. Seguimos convenciones de nombres para mantener la consistencia. El conjunto de datos incluye varios tipos de votos, como subvotos (sin elección) y sobravotos (más elecciones de las permitidas).
También consideramos temas de privacidad mientras preparábamos los datos. Nos aseguramos de no revelar elecciones específicas de votantes que pudieran ser rastreadas hasta votantes individuales. Por ejemplo, si se emitieron muy pocos votos en un precinto específico, combinamos datos con otros precintos para proteger el anonimato.
Cobertura Geográfica
Nuestra base de datos incluye 20 estados. Los datos de cada condado incluido están disponibles para análisis. Sin embargo, no todos los condados en todos los estados están representados. El conjunto de datos proporciona un vistazo a las tendencias y características de votantes, con comparaciones demográficas con la población general de EE. UU.
Validando los Datos
Para asegurarnos de que nuestros CVRs fueran precisos, realizamos validaciones exhaustivas a nivel de condado y precinto. Comparamos los totales de votos de nuestros CVRs con los reportados por fuentes oficiales.
Si encontrábamos discrepancias, investigábamos las razones detrás de ellas. A veces, faltaban precintos enteros en los CVRs, o ciertos métodos de votación no estaban incluidos. En algunas ocasiones, los condados tuvieron que ocultar ciertas elecciones para proteger el secreto de la boleta.
Aprendiendo de los Datos
También proporcionamos algunas pautas sobre cómo trabajar con el conjunto de datos. Los usuarios pueden leer los datos utilizando lenguajes de programación como R o Python. El conjunto de datos está estructurado para facilitar la producción de resúmenes rápidamente.
Por ejemplo, los investigadores pueden explorar la lealtad partidaria viendo cuántos votantes republicanos eligieron a Trump, y cuántos demócratas votaron por Biden. Al filtrar los datos según el estado y el condado, los usuarios pueden realizar varios análisis libremente.
Conclusión
Los registros de votos emitidos de las elecciones de EE. UU. de 2020 han abierto una puerta para la investigación y el análisis en ciencia política y administración electoral. Con este conjunto de datos, podemos descubrir patrones y comportamientos de votación de formas que antes eran difíciles, si no imposibles.
A medida que avanzamos, entender las implicaciones de estos registros y las tendencias que revelan será vital para asegurar la confianza en el proceso electoral. Con el interés continuo en la integridad electoral, nuestro trabajo con los CVRs proporciona una sólida base para futuras investigaciones.
Así que agarra tu lupa y ¡vamos a sumergirnos en los números!
Título: Cast vote records: A database of ballots from the 2020 U.S. Election
Resumen: Ballots are the core records of elections. Electronic records of actual ballots cast (cast vote records) are available to the public in some jurisdictions. However, they have been released in a variety of formats and have not been independently evaluated. Here we introduce a database of cast vote records from the 2020 U.S. general election. We downloaded publicly available unstandardized cast vote records, standardized them into a multi-state database, and extensively compared their totals to certified election results. Our release includes vote records for President, Governor, U.S. Senate and House, and state upper and lower chambers -- covering 42.7 million voters in 20 states who voted for more than 2,204 candidates. This database serves as a uniquely granular administrative dataset for studying voting behavior and election administration. Using this data, we show that in battleground states, 1.9 percent of solid Republicans (as defined by their congressional and state legislative voting) in our database split their ticket for Joe Biden, while 1.2 percent of solid Democrats split their ticket for Donald Trump.
Autores: Shiro Kuriwaki, Mason Reece, Samuel Baltz, Aleksandra Conevska, Joseph R. Loffredo, Can Mutlu, Taran Samarth, Kevin E. Acevedo Jetter, Zachary Djanogly Garai, Kate Murray, Shigeo Hirano, Jeffrey B. Lewis, James M. Snyder, Charles H. Stewart
Última actualización: 2024-10-24 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2411.05020
Fuente PDF: https://arxiv.org/pdf/2411.05020
Licencia: https://creativecommons.org/licenses/by-sa/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.
Enlaces de referencia
- https://doi.org/10.7910/DVN/PQQ3KV
- https://verifiedvoting.org/verifier
- https://github.com/kuriwaki/cvr_harvard-mit_scripts/issues
- https://bit.ly/46eISNX
- https://r4ds.hadley.nz/arrow
- https://arrow.apache.org/docs/python/parquet.html
- https://github.com/kuriwaki/cvr_harvard-mit_scripts
- https://github.com/kuriwaki/dominionCVR
- https://github.com/kuriwaki/cvr_harvard-mit_scripts/tree/main/code/01_build-returns/code
- https://ballotpedia.org/Georgia
- https://bit.ly/3RYhL3A