Entendiendo las predicciones de fútbol en Inglaterra
Una mirada a predecir los resultados de partidos de fútbol en diferentes ligas.
Josh Brown, Yutong Bu, Zachary Cheesman, Benjamin Orman, Iris Horng, Samuel Thomas, Amanda Harsy, Adam Schultze
― 9 minilectura
Tabla de contenidos
- El Sistema de Ligas por Niveles
- La Dificultad de Predecir Resultados
- Investigación Anterior y Limitaciones de Datos
- El Papel de las Valoraciones de Jugadores
- La Estructura de Nuestro Estudio
- Los Métodos de Clasificación Colley y Massey
- Recopilación de Datos y Métricas
- Enfoques de Modelado
- Analizando Nuestras Predicciones
- El Impacto de los Equipos Dominantes
- Perspectivas de Otras Ligas
- Valoraciones del Mercado y la Sabiduría de la Multitud
- Conclusión y Direcciones Futuras
- Fuente original
- Enlaces de referencia
El fútbol, o como algunos lo llaman, soccer, tiene una larga historia en Inglaterra. Las reglas oficiales del deporte se establecieron en 1863, lo que lo convierte en uno de los deportes organizados más antiguos. Con el paso de los años, el juego ha crecido y evolucionado en un sistema de ligas bien estructurado conocido como el pirámide del fútbol inglés. En la cima de esta pirámide está la Premier League inglesa (EPL), la crème de la crème de las ligas de fútbol, ¡no solo en Inglaterra sino en el mundo! La EPL es donde hay mucha pasta; durante la temporada 2022-2023, generó la friolera de $6.9 mil millones en ingresos. Es como tener un asiento premium para el gran espectáculo de la ciudad, mientras que otras ligas, como el Championship inglés, League One y League Two, tienen que conformarse con las migajas de la mesa.
El Sistema de Ligas por Niveles
Esta pirámide de fútbol es única porque ofrece un sistema de promoción y descenso, un poco como un juego de sillas musicales. Si haces bien tu trabajo en tu liga, te ascienden a un nivel más alto, y si te va mal, bueno, podrías encontrarte bajando un nivel. Por ejemplo, un equipo que logra saltar de la League Two a la Premier League puede ver un increíble aumento en sus ingresos-¡al menos $160 millones en tres años! Eso es una buena ganancia para un equipo que podría haber estado viviendo de fideos instantáneos antes.
Sin embargo, no todas las ligas son iguales. Las diferencias financieras entre ellas son significativas. El Championship hizo alrededor de $890 millones en el mismo año, mientras que la League One y la League Two generaron $280 millones y $156 millones, respectivamente. Estas diferencias crean una competencia muy intensa en todos los niveles del fútbol de clubes inglés. ¡Todos quieren estar en la cima!
La Dificultad de Predecir Resultados
A pesar de la emoción y la competencia, predecir los resultados de estos partidos no es tan fácil como lanzar una moneda. De hecho, resulta que pronosticar juegos en ligas más bajas es generalmente más complicado que en la Premier League. Eso es porque los Equipos menos conocidos pueden ser un poco impredecibles. Sin embargo, cuando retiramos a los equipos que dominan consistentemente en sus ligas, encontramos que predecir la Premier League puede ser igual de complicado que las ligas inferiores.
Investigación Anterior y Limitaciones de Datos
A pesar de la cantidad de datos disponibles sobre las ligas de fútbol inglesas, no se ha hecho mucha investigación sobre las ligas de niveles más bajos. La mayoría de los estudios se centran en las ligas de primer nivel, dejando a los niveles inferiores en la oscuridad. Un ejemplo de alguien que se atrevió a hacerlo es Artzen y Hvattum, quienes utilizaron el sistema de clasificación Elo para predecir los resultados de partidos en ligas inferiores. Sin embargo, los modelos matemáticos tradicionales como los creados por Massey y Colley no han sido explorados completamente en estas ligas más bajas.
El Papel de las Valoraciones de Jugadores
Para ayudarnos con nuestras predicciones, recurrimos a las valoraciones de jugadores de Transfermarkt, un sitio donde los aficionados discuten el valor de los jugadores. Es como un bazar en línea donde los entusiastas del fútbol regatean sobre quién vale qué. Este enfoque basado en la opinión popular para determinar el valor de los jugadores es bastante popular entre cazatalentos y ejecutivos de clubes, dándole un poco de credibilidad.
Decidimos ver si estas valoraciones podían ayudarnos a predecir los resultados de los partidos en ligas inferiores. La idea es que si los aficionados están hablando sobre los valores de los jugadores, podrían tener una pista sobre cómo se desempeñarán los equipos. Después de todo, si un jugador tiene un alto valor, podría aportar un poco más de talento al campo.
La Estructura de Nuestro Estudio
En nuestra investigación, nos propusimos comparar diferentes modelos matemáticos para ver cómo pueden predecir resultados en varios niveles del sistema de fútbol inglés. Dividiremos nuestros hallazgos en secciones:
-
Introducción a los Métodos de Clasificación Colley y Massey: Daremos un poco de contexto sobre estos métodos de clasificación matemática y por qué son útiles.
-
Datos y Métricas: Cubriremos cómo recopilamos nuestros datos y qué métricas utilizamos para evaluar nuestros modelos.
-
Enfoques de Modelado: Nos adentraremos en nuestros diferentes métodos de modelado, incluyendo las valoraciones de Transfermarkt.
-
Análisis de Predicciones: Compartiremos cómo se desempeñaron nuestros modelos contra los resultados reales de los partidos en ligas inglesas, alemanas y escocesas.
-
Conclusiones y Direcciones Futuras: Finalmente, concluiremos con lo que significan nuestros hallazgos y áreas potenciales para futuras investigaciones.
Los Métodos de Clasificación Colley y Massey
Los métodos Colley y Massey son dos sistemas de clasificación clásicos utilizados para evaluar el rendimiento de los equipos deportivos. Ambos métodos utilizan estadísticas de partidos pasados, pero abordan los datos de manera diferente.
El método Colley se centra en el porcentaje de victorias y la fuerza de los equipos jugados. Es como tratar de averiguar qué tan bueno es un equipo considerando no solo cuántos partidos ganó, sino también a quiénes enfrentó. Si un equipo tiene un alto porcentaje de victorias pero ha enfrentado oponentes débiles, su clasificación puede no ser tan alta.
Por otro lado, el método Massey usa el diferencial de puntos en los partidos. Este método asume que la fuerza de los equipos afecta el resultado final de un partido. Por ejemplo, si el Equipo A le gana al Equipo B por un amplio margen, podemos inferir que el Equipo A es más fuerte.
Recopilación de Datos y Métricas
Nuestro estudio implicó recopilar un montón de datos de varias ligas a lo largo de varios años. Recopilamos resultados de partidos, plantillas de equipos y valoraciones de jugadores de Transfermarkt, que es como un tesoro de estadísticas de fútbol.
Nos enfocamos en los cuatro niveles más altos del sistema de ligas de fútbol inglés, junto con datos de algunas ligas alemanas y escocesas. El objetivo era compilar un conjunto de datos sólido que pudiéramos usar para probar nuestros modelos predictivos.
Enfoques de Modelado
Ponemos a prueba un par de modelos diferentes. Primero, utilizamos los rankings clásicos de Colley y Massey por sí solos. Luego, agregamos algunos giros, como incluir la ventaja de local y las valoraciones de jugadores de Transfermarkt para ver si esos factores podían mejorar nuestras predicciones.
Para nuestro modelo de odds de apuestas, nos basamos en la sabiduría del mundo de las apuestas. Los corredores de apuestas saben lo suyo y tienen un ojo agudo para predecir resultados, así que pensamos que sería inteligente comparar nuestros modelos con sus odds.
Analizando Nuestras Predicciones
Una vez que tuvimos nuestros modelos en marcha, evaluamos qué tan bien se desempeñaron al comparar sus predicciones con los resultados reales de los partidos. Nos enfocamos en métricas como la precisión del ranking y las predicciones de resultados de partidos.
Nuestros modelos mostraron patrones interesantes. Las predicciones para los juegos de la Premier League resultaron ser más precisas que las de las ligas inferiores. Pero cuando eliminamos los partidos que involucraban a los equipos principales, las diferencias en precisión entre las ligas se volvieron menos pronunciadas.
El Impacto de los Equipos Dominantes
Nuestros hallazgos destacaron el impacto significativo que los equipos dominantes, a menudo llamados los "Seis Grandes" en la Premier League, tienen en los modelos de predicción. Estos equipos han tenido históricamente un mejor rendimiento y sesgan las predicciones a su favor.
Volvimos a ejecutar los modelos, esta vez excluyendo cualquier partido que involucrara a estos equipos dominantes. Sorprendentemente, esto acercó nuestras habilidades predictivas a las de las ligas inferiores. Parece que la dominación de unos pocos equipos puede complicar más de la cuenta el pronóstico.
Perspectivas de Otras Ligas
Para ampliar nuestra comprensión, también evaluamos los modelos utilizando datos de las ligas alemanas y escocesas. Si bien estas ligas tienen sus peculiaridades, nuestros hallazgos generalmente se alinearon con lo que descubrimos en las ligas inglesas. Los modelos funcionaron mejor en las ligas de primer nivel en comparación con las ligas inferiores en general.
Valoraciones del Mercado y la Sabiduría de la Multitud
El concepto de "sabiduría de la multitud" sugiere que un grupo más grande a menudo llega a una conclusión más precisa que un individuo o un pequeño grupo. En nuestro caso, si la multitud puede calificar efectivamente a los jugadores en Transfermarkt, sus ideas deberían mejorar las predicciones, ¿verdad? Bueno, más o menos.
Si bien descubrimos que las valoraciones de Transfermarkt proporcionaron cierto poder predictivo, no necesariamente superaron a los métodos tradicionales en lo que respecta al fútbol de clubes. Esto plantea la pregunta: ¿realmente la colaboración de la multitud es tan buena como se dice? Tal vez esos tipos hablando sobre los valores de los jugadores solo estén lanzando dardos a un tablero después de todo.
Conclusión y Direcciones Futuras
En resumen, nuestra investigación muestra que diferentes modelos matemáticos pueden ayudar a predecir los resultados de los partidos de fútbol, pero la efectividad varía entre ligas. Si bien los modelos funcionaron bien en la Premier League, tuvieron problemas con las ligas inferiores, especialmente cuando había equipos dominantes en juego.
De cara al futuro, vemos mucho espacio para mejorar. Hay potencial para perfeccionar los modelos al tener en cuenta mejor los partidos que terminan en empate o al incorporar métricas adicionales como estadísticas de jugadores. Explorar los efectos de los equipos dominantes en el equilibrio competitivo también podría proporcionar información valiosa.
Con la popularidad global del fútbol, no hay escasez de datos para investigar. Así que agarra tu snack favorito y acomódate, ¡porque el mundo de la analítica del fútbol apenas está comenzando!
Título: Predictive Modeling of Lower-Level English Club Soccer Using Crowd-Sourced Player Valuations
Resumen: In this research, we examine the capabilities of different mathematical models to accurately predict various levels of the English football pyramid. Existing work has largely focused on top-level play in European leagues; however, our work analyzes teams throughout the entire English Football League system. We modeled team performance using weighted Colley and Massey ranking methods which incorporate player valuations from the widely-used website Transfermarkt to predict game outcomes. Our initial analysis found that lower leagues are more difficult to forecast in general. Yet, after removing dominant outlier teams from the analysis, we found that top leagues were just as difficult to predict as lower leagues. We also extended our findings using data from multiple German and Scottish leagues. Finally, we discuss reasons to doubt attributing Transfermarkt's predictive value to wisdom of the crowd.
Autores: Josh Brown, Yutong Bu, Zachary Cheesman, Benjamin Orman, Iris Horng, Samuel Thomas, Amanda Harsy, Adam Schultze
Última actualización: 2024-11-13 00:00:00
Idioma: English
Fuente URL: https://arxiv.org/abs/2411.09085
Fuente PDF: https://arxiv.org/pdf/2411.09085
Licencia: https://creativecommons.org/licenses/by/4.0/
Cambios: Este resumen se ha elaborado con la ayuda de AI y puede contener imprecisiones. Para obtener información precisa, consulte los documentos originales enlazados aquí.
Gracias a arxiv por el uso de su interoperabilidad de acceso abierto.