Introducción
El objetivo de este proyecto de modelado era predecir el resultado de las elecciones de 2024 utilizando datos demográficos, históricos y de salud pública. Este enfoque único se basa en predictores que son un indicador del apoyo público al Partido Demócrata dentro de una población. En los EE. UU., nos enfrentamos a una elección binaria, demócrata o republicano, y nuestra elección se decide por los votos electorales de cada estado. Por lo tanto, la métrica de respuesta predicha fue simplemente el margen de victoria dentro de un estado.
Debido al Colegio Electoral, predecir las elecciones es básicamente una cuestión de predecir un puñado de estados. La mayoría de los estados tienen un historial confiable de un amplio margen de victoria para uno u otro partido, mientras que unos pocos no lo tienen. Los datos y el modelo serán precisos en la medida en que predigan con precisión estos estados. Debido al menor tamaño de la muestra de las elecciones nacionales recientes y la importancia de los puntos de datos recientes en el modelo, no será capaz de producir predicciones altamente precisas para los estados con márgenes de victoria estrechos. Por lo tanto, el éxito de este modelo dependerá de su capacidad para detectar qué estados indecisos podrían tener más apoyo para los demócratas (o republicanos) del que se detecta actualmente en las encuestas.
Antecedentes y suposiciones
En los dos últimos ciclos electorales presidenciales, hemos visto cómo las encuestas públicas han fallado de forma importante. En 2016, casi todas las encuestadoras y medios de comunicación importantes no detectaron el grado de apoyo público entre los demócratas y los independientes que llevó a la victoria de Trump en los estados clave y en el Cinturón del Óxido. En 2020, las encuestadoras volvieron a subestimar el apoyo a Trump en los estados clave. Desde entonces, la confianza en la capacidad de los medios de comunicación para investigar y llegar a la verdad se ha erosionado aún más.
Este análisis busca encontrar predictores que reflejen un estado más preciso de la preferencia política del público que no estén sujetos a las debilidades de los sesgos de la industria de las encuestas. Debido a la naturaleza hiperpolarizada de la pandemia de Covid-19 y las líneas explícitamente claras en las que se redujo el apoyo a la vacuna Covid-19, la aceptación pública de la “nueva” versión de una vacuna Covid-19 de cada año está altamente correlacionada con el apoyo al Partido Demócrata. Debido a que hay una nueva vacuna Covid-19 cada año, se supone que la aceptación continua indica lealtad al voto demócrata. Otros indicadores, como la tasa de migración interna y las solicitudes de voto por correo, están fuertemente correlacionados con el apoyo demócrata durante los últimos cuatro años.
Además, se han utilizado datos de población de fuentes de salud pública como variables de control o predictivas, incluidas la tasa de mortalidad, la tasa de natalidad y la salud mental. Algunas dinámicas demográficas y de población están asociadas con estados con mayor inclinación republicana y otras con estados con inclinación demócrata, y estas relaciones se han mantenido a lo largo del tiempo en la historia reciente. Otras medidas, como la tasa de migración neta, tienen fuertes asociaciones, pero son más recientes y se vieron afectadas por la pandemia de Covid-19, durante la cual muchos estados azules confinados sufrieron una pérdida neta, y los estados rojos abiertos vieron una ganancia neta. La popularidad de la vacuna contra el Covid-19, que ahora se aplica anualmente, está disminuyendo año tras año, y los datos se han ajustado para medir la popularidad relativa, y los estados con una aceptación general mayor que el promedio reflejan un mayor apoyo al partido demócrata.
En general, este análisis busca combinar tendencias de largo plazo y tendencias más recientes para estimar el nivel actual de apoyo al Partido Demócrata. Como el modelo debe entrenarse con datos que solo están disponibles en los meses (vacunas contra el Covid) y semanas (solicitudes de voto por correo) previos a las elecciones, no podrá detectar cambios de última hora.
Como dijo George Box, “todos los modelos son erróneos, pero algunos son útiles”. Mi esperanza con este análisis es que pueda ser útil para detectar señales que podrían no estar presentes en las encuestas electorales tradicionales. Además de la predicción (que es principalmente por diversión), he incluido algunos análisis de estados clave que creo que podrían arrojar algo de luz sobre los cambios clave que han estado ocurriendo en los últimos cuatro años.
Métodos
Como la explicabilidad y la interpretación son fundamentales en el contexto electoral, me he quedado con modelos simples. Los modelos de modelado lineal generalizado, regresión logística y bosque aleatorio se entrenaron con datos de 2020 a 2022. El resultado, o la respuesta, fue el margen de victoria del Partido Demócrata. Para el modelo logístico, la respuesta predicha fue una victoria o una derrota binaria para ese estado. Como cada modelo tiene sus propias fortalezas y debilidades, junto con sus propias tasas de error, la clasificación final de una victoria o una derrota estará determinada por el voto mayoritario. He subido mi código y mis datos a gitHuby cualquiera es bienvenido a criticar, corregir o brindar comentarios.
Limitaciones
Debido a mi decisión de utilizar la tasa de vacunación contra la COVID-19 en los estados como predictor, esto limita el cronograma y los datos que se pueden recopilar. Debido a esto, espero que el modelo tenga un sesgo hacia los demócratas. De 50 estados, cinco cayeron dentro del rango de errores. Los cinco estados se consideran estados clave. A los efectos de categorización, solo los estados que quedan claramente fuera de los errores de mis modelos se categorizarán como una victoria para ese partido. Los que están dentro de los rangos de error se categorizarán como indecisos.
Discusión
Como en Estados Unidos las elecciones son una elección binaria, el análisis solo considera a los demócratas frente a los republicanos y no puede detectar cambios en el apoyo a un candidato entre los votantes del partido opuesto. Esto revela un supuesto central del modelo: que en estas elecciones todavía se trata principalmente de la lealtad partidaria por encima del candidato individual.
En el caso de la candidata demócrata Kamala Harris, creo que esta suposición es válida, ya que no fue elegida por voto popular durante las primarias y gran parte de la campaña se ha centrado en crear una personalidad estratégicamente elaborada a partir de una mujer que hasta hace poco había sido en gran medida ignorada, descartada e incluso objeto de burlas. Podemos ver que en los últimos meses, los debates, los intentos de asesinato y otros momentos importantes simplemente no han tenido ningún efecto importante en las tendencias de las encuestas.
En el caso de Donald Trump, no creo que esta suposición sea válida. La conocida personalidad de Trump es dominante y omnipresente. Desde su presidencia de 2017 a 2021 y sus continuas batallas con demandas judiciales, intentos de asesinato y obsesión mediática, la victoria de Trump dice mucho más de él que del Partido Republicano. El Partido Demócrata es una máquina, y el Partido Republicano sólo solidificó su apoyo a Trump a regañadientes después de años de luchas internas y división entre sus líderes.
Como el modelo utiliza datos tanto de las elecciones presidenciales de 2020 como de las elecciones al Senado de 2022, está entrenado para modelar el apoyo a los partidos, de ahí su debilidad inherente. Las encuestas recientes han cambiado a favor de Trump, pero hay importantes estados clave en empate. Siguiendo mis métodos y la intención de este ejercicio, no se incluye ninguno de esos datos.
Análisis de los estados en disputa
El resultado de las elecciones lo determinarán un puñado de estados. Actualmente, las reñidas contiendas en Arizona, Nevada, Wisconsin, Michigan, Carolina del Norte, Georgia y Pensilvania son suficientes para inclinar la elección a favor de cualquiera de ellos. De esos estados, el modelo clasificó a Michigan y Pensilvania como estados con posibilidades de ganar por el Partido Demócrata. Los estados restantes estaban todos dentro del rango de error del modelo y, por lo tanto, se clasificaron como estados indecisos.
Para brindar un contexto visual de cómo funciona este análisis, a continuación se presentan algunos desgloses de algunos de los predictores de los estados que generalmente se consideran estados clave.
Tasas de migración interna: 2019-2023*
En general, existe una relación negativa entre la tasa de migración neta y el margen de victoria demócrata. En los últimos cuatro años, muchos estados azules han estado perdiendo población, mientras que los rojos Los estados han ganadoEn el caso de estos estados clave, algunos son “rojos” en lo que respecta a gobernadores y gobiernos estatales, y otros son “azules”. En general, Pensilvania y Michigan son los únicos dos que han tenido tasas de migración negativas en los últimos 2 años.
Solicitudes de boletas para votar por correo
Algunos estados, como California, Colorado y Nevada, son estados de “todo correo”, lo que significa que a cada votante registrado se le envía una papeleta de votación por correo de manera predeterminada. Con la excepción de Utah (y posiblemente Nevada), casi todos estos estados son estados azules y son completamente azules. Nevada es el único estado clave que es un estado de todo correo, como puede ver, sus solicitudes se mantienen sin cambios. La tendencia general en la mayoría de los demás, excepto Arizona, es una disminución en las solicitudes de voto por correo.
Participación anual en la vacuna contra la COVID-19**
Dado que el modelo utiliza la vacunación anual contra la COVID-19 como fuerte predictor El apoyo del Partido Demócrata es muy bajo, pero la popularidad general está disminuyendo. El modelo utiliza una puntuación relativa para comparar cada estado con los demás durante el año. Aparte de Wisconsin, los estados restantes tuvieron una aceptación de la vacuna contra la COVID-19 ligeramente por debajo del promedio en 2021**, 2022 y 2024.
*Las tasas de migración interna corresponden a las del año anterior.
**Dado que las vacunas contra el Covid-19 no estuvieron disponibles hasta 2021, los datos de 2021 se combinaron con los datos de los resultados electorales de 2020. Para 2022 y 2024, los datos reflejan la aceptación de la nueva versión de ese año.
Para tener una idea de la importancia de los predictores para el modelo, el gráfico a continuación clasifica cada medida en función de cuánto afecta a una de las predicciones del modelo. Como puede ver, la aceptación de la vacuna contra la COVID-19 se clasifica justo debajo de la "victoria demócrata anterior".
Resultados
El modelo prevé que Harris obtenga con seguridad 260 votos electorales en los estados que, según él, serán demócratas. Si Pensilvania y Michigan están en la contienda, entonces solo 226 de ellos serán demócratas.
El modelo prevé que Trump obtendrá con seguridad 219 votos electorales en los estados que, según predice, serán con seguridad republicanos.
Los estados clave Wisconsin, Georgia, Carolina del Norte, Nevada y Arizona están en juego y representan 59 votos electorales. Si Pensilvania y Michigan están en la contienda, son 93 los votos electorales en juego.
El camino de Harris hacia la victoria
El camino de Harris hacia la victoria parece más fácil. Con un mayor número de votos electorales iniciales “en el bolsillo”, puede conseguir un puñado de estados clave. Pensilvania y Michigan aparecen como estados clave para ella en el modelo, y si gana en ellos, simplemente necesita cualquiera de los siguientes: Arizona, Carolina del Norte, Wisconsin o Georgia para asegurar el triunfo. Si gana en uno u otro de los dos estados clave, Pensilvania o Michigan, entonces necesita reemplazar la derrota con uno o dos estados clave adicionales.
El camino de Trump hacia la victoria
Es importante analizar el camino de Trump con la mentalidad de que “todo puede pasar”. Ha superado las expectativas en ambas elecciones anteriores. La mayoría de los guardianes de la información, los expertos tradicionales y los encuestadores electorales se han equivocado en el pasado.
Con 219 en el bolsillo, Trump debe ganar todos los estados indecisos: Arizona, Georgia, Carolina del Norte, Wisconsin y Nevada. Si Trump gana Pensilvania y/o Michigan, entonces su camino se vuelve más fácil, lo que significa que todavía necesitaría ganar 2 o 3 de los estados indecisos restantes.
Eche un vistazo al siguiente panel. Interactúe para ver cómo avanza cada candidato hacia la victoria al ganar los estados en disputa y vea los diagramas de dispersión para las predicciones medidas por estado.
Mis predicciones personales basadas en el modelo
Tengo una intuición más clara sobre Carolina del Norte y Georgia, ya que paso tiempo allí, y creo que Trump ganará en esos estados. No tengo esa intuición sobre Arizona, Nevada o Wisconsin, así que tómenlo con pinzas. Pero siendo fiel al método, mi modelo dice que Harris ganará en Pensilvania y Michigan, y creo que ganará al menos en otros dos o tres estados clave. Espero estar equivocado.
Referencias:
Laboratorio de elecciones del MIT https://electionlab.mit.edu/data#data
Hechos de estados unidos https://usafacts.org/economy/
Laboratorio de elecciones de la UF https://election.lab.ufl.edu/voter-turnout/
Votación y registro en las elecciones de noviembre de 2022 https://www.census.gov/data/tables/time-series/demo/voting-and-registration/p20-586.html
CDC https://data.cdc.gov/NCHS/Indicators-of-Anxiety-or-Depression-Based-on-Repor/8pt5-q6wp/about_data
CMS https://data.cms.gov/provider-data/dataset/avax-cv19
CDC https://www.cdc.gov/covidvaxview/weekly-dashboard/vaccine-administration-coverage-jurisdiction.html
Cinco treinta y ocho https://github.com/fivethirtyeight/election-results/blob/main/election_results_senate.csv
Monitor de vacunas KFF https://www.kff.org/coronavirus-covid-19/dashboard/kff-covid-19-vaccine-monitor-dashboard/
Laboratorio de elecciones de la UF https://election.lab.ufl.edu/2024-presidential-nomination-contests-turnout-rates/
Centro Nacional de Estadísticas de Salud https://www.cdc.gov/nchs/data_access/VitalStatsOnline.htm CDC https://www.cdc.gov/nchs/data/vsrr/vsrr035.pdf Censo.Gov https://www.census.gov/data/tables/time-series/demo/popest/2020s-state-total.htmlCDC https://www.cdc.gov/covidvaxview/interactive/adults.html
Centro Nacional de Estadísticas de Salud https://www.cdc.gov/nchs/fastats/state-and-territorial-data.htm
Censo- Pobreza https://www.census.gov/data/tables/time-series/demo/income-poverty/historical-poverty-people.html
Censo - Cambios de población por estado https://www.census.gov/newsroom/press-kits/2023/national-state-population-estimates.html
Proyecto electoral de EE. UU. https://electproject.github.io/
Reeditado del autor Substack
Publicado bajo un Licencia de Creative Commons Atribución Internacional
Para reimpresiones, vuelva a establecer el enlace canónico en el original Instituto Brownstone Artículo y Autor.