Capire le previsioni sul calcio in Inghilterra
Uno sguardo a come prevedere i risultati delle partite di calcio in diverse leghe.
Josh Brown, Yutong Bu, Zachary Cheesman, Benjamin Orman, Iris Horng, Samuel Thomas, Amanda Harsy, Adam Schultze
― 8 leggere min
Indice
- Il Sistema di Leghe a Livelli
- La Difficoltà di Prevedere i Risultati
- Ricerche Precedenti e Limitazioni dei Dati
- Il Ruolo delle Valutazioni dei Giocatori
- La Struttura del Nostro Studio
- I Metodi di Ranking Colley e Massey
- Raccolta Dati e Metriche
- Approcci di Modellazione
- Analizzando le Nostre Previsioni
- L'Impatto delle Squadre Dominanti
- Intuizioni da Altre Leghe
- Valutazioni di Mercato e la Saggezza della Folla
- Conclusione e Direzioni Future
- Fonte originale
- Link di riferimento
Il calcio, o come alcuni lo chiamano, football, ha una lunga storia in Inghilterra. Le regole ufficiali per questo sport sono state stabilite nel 1863, rendendolo uno dei più antichi sport organizzati. Negli anni, il gioco è cresciuto e si è evoluto in un sistema di leghe ben strutturato conosciuto come il "piramide del calcio inglese". In cima a questa piramide c'è la Premier League inglese (EPL), il meglio delle leghe di calcio, non solo in Inghilterra ma nel mondo! L'EPL è dove girano grandi soldi; durante la stagione 2022-2023, ha incassato ben 6,9 miliardi di dollari. È come avere un posto in prima fila per il più grande spettacolo in città, mentre altre leghe, come il Campionato inglese, la League One e la League Two, restano a raccogliere le briciole.
Il Sistema di Leghe a Livelli
Questa piramide calcistica è unica perché offre un sistema di promozione e retrocessione, un po' come un gioco di sedie musicali. Se te la cavi bene nella tua lega, vieni promosso a un livello superiore, e se vai male, beh, potresti trovarti a scendere di livello. Per esempio, una Squadra che riesce a passare dalla League Two alla Premier League può vedere un incredibile aumento del loro fatturato-di almeno 160 milioni di dollari in tre anni! È un bel gruzzoletto per una squadra che potrebbe aver mangiato ramen prima.
Tuttavia, non tutte le leghe sono uguali. Le differenze finanziarie tra di loro sono significative. Il Campionato ha fatto circa 890 milioni di dollari nello stesso anno, mentre la League One e la League Two hanno incassato rispettivamente 280 milioni e 156 milioni. Queste differenze creano una competizione molto intensa in tutti i livelli del calcio dei club inglesi. Tutti vogliono essere i migliori!
La Difficoltà di Prevedere i Risultati
Nonostante l'eccitazione e la competizione, prevedere i risultati di queste partite non è così facile come lanciare una monetina. Infatti, si scopre che prevedere le partite nelle leghe inferiori è generalmente più difficile che nella Premier League. Questo perché le squadre meno conosciute possono essere un po' imprevedibili. Tuttavia, quando rimuoviamo le squadre che dominano costantemente le loro leghe, scopriamo che prevedere la Premier League può essere altrettanto complicato delle leghe inferiori.
Ricerche Precedenti e Limitazioni dei Dati
Nonostante l'abbondanza di dati disponibili sulle leghe di calcio inglesi, non sono state svolte molte ricerche sulle leghe di livello inferiore. La maggior parte degli studi si concentra sulle leghe di alto livello, lasciando nell'ombra i livelli inferiori. Un esempio di qualcuno che ha provato a farlo è Artzen e Hvattum, che hanno utilizzato il sistema di rating Elo per prevedere i risultati delle partite nelle leghe inferiori. Tuttavia, i modelli matematici tradizionali come quelli creati da Massey e Colley non sono stati completamente esplorati in queste leghe inferiori.
Il Ruolo delle Valutazioni dei Giocatori
Per aiutarci con le nostre previsioni, ci siamo rivolti alle valutazioni dei giocatori di Transfermarkt, un sito dove i tifosi discutono il valore dei giocatori. È come un fancy bazar online dove gli appassionati di calcio trattano su chi vale cosa. Questo approccio basato sul "crowd-sourcing" per determinare i valori dei giocatori è abbastanza popolare tra gli scout e i dirigenti dei club, conferendogli un certo credito.
Abbiamo deciso di vedere se queste valutazioni potessero aiutarci a prevedere i risultati delle partite nelle leghe inferiori. L'idea è che se i tifosi parlano dei valori dei giocatori, potrebbero avere qualche intuizione su come si comporteranno le squadre. Dopotutto, se un giocatore è molto valutato, potrebbe portare un po' più di talento in campo.
La Struttura del Nostro Studio
Nella nostra ricerca, ci siamo proposti di confrontare diversi modelli matematici per vedere come possono prevedere i risultati a vari livelli del sistema calcistico inglese. Divideremo i nostri risultati in sezioni:
-
Introduzione ai Metodi di Ranking Colley e Massey: Daremo un po' di contesto su questi metodi di ranking matematici e sul perché siano utili.
-
Dati e Metriche: Tratteremo di come abbiamo raccolto i nostri dati e quali metriche abbiamo usato per valutare i nostri modelli.
-
Approcci di Modellazione: Ci inoltreremo nei nostri diversi metodi di modellazione, comprese le valutazioni di Transfermarkt.
-
Analisi delle Previsioni: Condivideremo come i nostri modelli hanno performato rispetto ai risultati reali delle partite nelle leghe inglesi, tedesche e scozzesi.
-
Conclusioni e Direzioni Future: Infine, concluderemo con ciò che significano le nostre scoperte e potenziali aree per ulteriori ricerche.
I Metodi di Ranking Colley e Massey
I metodi Colley e Massey sono due sistemi di ranking classici usati per valutare le performance delle squadre sportive. Entrambi usano statistiche delle partite passate, ma si avvicinano ai dati in modo diverso.
Il metodo Colley si concentra sulla percentuale di vittorie e sulla forza delle squadre affrontate. È come cercare di capire quanto sia forte una squadra considerando non solo quante partite ha vinto, ma anche contro chi ha giocato. Se una squadra ha una percentuale di vittorie alta ma ha affrontato avversari deboli, il loro ranking potrebbe non essere così alto.
D'altra parte, il metodo Massey usa il differenziale punti nelle partite. Questo metodo assume che la forza delle squadre influenzi il punteggio finale di una partita. Per esempio, se la Squadra A batte la Squadra B con un ampio margine, possiamo dedurre che la Squadra A è più forte.
Raccolta Dati e Metriche
Il nostro studio ha coinvolto la raccolta di un sacco di dati da varie leghe in diversi anni. Abbiamo preso risultati delle partite, rose delle squadre e valutazioni dei giocatori da Transfermarkt, che è come un tesoro di statistiche calcistiche.
Ci siamo concentrati sui primi quattro livelli del sistema delle leghe di calcio inglese, insieme ai dati di alcune leghe tedesche e scozzesi. L'obiettivo era compilare un dataset solido che potessimo usare per testare i nostri modelli predittivi.
Approcci di Modellazione
Abbiamo messo alla prova un paio di modelli diversi. In primo luogo, abbiamo utilizzato i rankings classici di Colley e Massey da soli. Poi, abbiamo aggiunto alcune variabili, come il vantaggio del campo di casa e le valutazioni dei giocatori di Transfermarkt, per vedere se questi fattori potessero migliorare le nostre previsioni.
Per il nostro modello di quote per scommesse, ci siamo affidati alla saggezza del mondo delle scommesse. I bookmaker sanno il fatto loro e hanno un occhio attento per prevedere i risultati, quindi ci è sembrato intelligente confrontare i nostri modelli con le loro quote.
Analizzando le Nostre Previsioni
Una volta che avevamo i nostri modelli in atto, abbiamo valutato come si erano comportati confrontando le loro previsioni con i reali risultati delle partite. Ci siamo concentrati su metriche come l'accuratezza del ranking e le previsioni dei risultati delle partite.
I nostri modelli hanno mostrato schemi interessanti. Le previsioni per le partite della Premier League si sono rivelate più accurate rispetto a quelle delle leghe inferiori. Ma quando abbiamo rimosso le partite che coinvolgevano le squadre di vertice, le differenze di accuratezza tra le leghe sono diventate meno pronunciate.
L'Impatto delle Squadre Dominanti
Le nostre scoperte hanno messo in luce l'enorme impatto che le squadre dominanti, spesso chiamate "Big Six" nella Premier League, hanno sui modelli di previsione. Queste squadre storicamente performano meglio e distorcono le previsioni a loro favore.
Abbiamo ricalcolato i modelli, questa volta escludendo tutte le partite che coinvolgevano queste squadre dominanti. Sorprendentemente, questo ha avvicinato le nostre capacità predittive a quelle delle leghe inferiori! Sembra che il dominio di alcune squadre possa rendere le previsioni più complicate di quanto dovrebbero essere.
Intuizioni da Altre Leghe
Per ampliare la nostra comprensione, abbiamo anche valutato i modelli usando dati dalle leghe tedesche e scozzesi. Anche se queste leghe hanno le loro peculiarità, le nostre scoperte generalmente si allineavano con quanto scoperto nelle leghe inglesi. I modelli hanno performato meglio nelle leghe di alto livello rispetto a quelle inferiori in generale.
Valutazioni di Mercato e la Saggezza della Folla
Il concetto di "saggezza della folla" suggerisce che un gruppo più grande arriva spesso a una conclusione più accurata rispetto a un individuo o a un piccolo gruppo. Nel nostro caso, se la folla può valutare efficacemente i giocatori su Transfermarkt, le loro intuizioni dovrebbero migliorare le previsioni, giusto? Beh, in un certo senso.
Mentre abbiamo scoperto che le valutazioni di Transfermarkt fornivano un certo potere predittivo, non hanno necessariamente superato i metodi tradizionali quando si trattava di calcio dei club. Questo solleva la domanda: il crowd-sourcing è davvero tutto ciò che si dice? Forse quelle persone che parlano dei valori dei giocatori stanno semplicemente lanciando freccette su un bersaglio dopo tutto.
Conclusione e Direzioni Future
In sintesi, la nostra ricerca mostra che diversi modelli matematici possono aiutare a prevedere i risultati delle partite di calcio, ma l'efficacia varia tra le leghe. Mentre i modelli hanno performato bene nella Premier League, hanno faticato con le leghe inferiori, specialmente quando c'erano squadre dominanti in gioco.
Guardando avanti, vediamo molte possibilità di miglioramento. C'è potenziale per raffinare i modelli tenendo meglio conto delle partite che terminano in pareggio o incorporando metriche aggiuntive come le statistiche dei giocatori. Esplorare gli effetti delle squadre dominanti sul bilanciamento competitivo potrebbe anche fornire intuizioni preziose.
Con la popolarità globale del calcio, non manca certo il materiale su cui lavorare. Quindi prendi il tuo snack preferito e mettiti comodo, perché il mondo dell'analytics calcistico sta appena iniziando!
Titolo: Predictive Modeling of Lower-Level English Club Soccer Using Crowd-Sourced Player Valuations
Estratto: In this research, we examine the capabilities of different mathematical models to accurately predict various levels of the English football pyramid. Existing work has largely focused on top-level play in European leagues; however, our work analyzes teams throughout the entire English Football League system. We modeled team performance using weighted Colley and Massey ranking methods which incorporate player valuations from the widely-used website Transfermarkt to predict game outcomes. Our initial analysis found that lower leagues are more difficult to forecast in general. Yet, after removing dominant outlier teams from the analysis, we found that top leagues were just as difficult to predict as lower leagues. We also extended our findings using data from multiple German and Scottish leagues. Finally, we discuss reasons to doubt attributing Transfermarkt's predictive value to wisdom of the crowd.
Autori: Josh Brown, Yutong Bu, Zachary Cheesman, Benjamin Orman, Iris Horng, Samuel Thomas, Amanda Harsy, Adam Schultze
Ultimo aggiornamento: 2024-11-13 00:00:00
Lingua: English
URL di origine: https://arxiv.org/abs/2411.09085
Fonte PDF: https://arxiv.org/pdf/2411.09085
Licenza: https://creativecommons.org/licenses/by/4.0/
Modifiche: Questa sintesi è stata creata con l'assistenza di AI e potrebbe presentare delle imprecisioni. Per informazioni accurate, consultare i documenti originali collegati qui.
Si ringrazia arxiv per l'utilizzo della sua interoperabilità ad accesso aperto.