Simple Science

Hochmoderne Wissenschaft einfach erklärt

# Statistik # Anwendungen

Verstehen von Fussballprognosen in England

Ein Blick darauf, wie man die Ergebnisse von Fussballspielen in verschiedenen Ligen vorhersagen kann.

Josh Brown, Yutong Bu, Zachary Cheesman, Benjamin Orman, Iris Horng, Samuel Thomas, Amanda Harsy, Adam Schultze

― 8 min Lesedauer


Vorhersagen von Vorhersagen von Fussballspiel-Ergebnissen englischen Fussballligen. Analyse von Vorhersagemethoden in
Inhaltsverzeichnis

Fussball, oder wie manche es nennen, Soccer, hat eine lange Geschichte in England. Die offiziellen Regeln für den Sport wurden 1863 festgelegt, was ihn zu einem der ältesten organisierten Sportarten macht. Im Laufe der Jahre hat sich das Spiel entwickelt und ist zu einem gut strukturierten Ligasystem geworden, das als die englische Fussballpyramide bekannt ist. An der Spitze dieser Pyramide steht die englische Premier League (EPL), die Crème de la Crème der Fussballligen, nicht nur in England, sondern auf der ganzen Welt! Die EPL ist der Ort, wo das grosse Geld fliesst; in der Saison 2022-2023 wurden unglaubliche 6,9 Milliarden Dollar an Einnahmen erzielt. Das ist, als hätte man einen Premiumplatz für die grösste Show der Stadt, während andere Ligen wie die englische Championship, League One und League Two mit den Brotkrumen vom Tisch zufrieden sein müssen.

Das gestufte Ligasystem

Diese Fussballpyramide ist einzigartig, weil sie ein Aufstiegs- und Abstiegssystem bietet, ein bisschen wie ein Spiel Stühle rücken. Wenn du in deiner Liga gut abschneidest, wirst du in eine höhere Stufe befördert, und wenn du schlecht spielst, naja, dann könnte es sein, dass du in eine niedrigere Liga fällst. Zum Beispiel kann ein Team, das es schafft, von der League Two in die Premier League aufzusteigen, einen unglaublichen Einnahmeschub von mindestens 160 Millionen Dollar über drei Jahre sehen! Das ist ein nettes Sümmchen für ein Team, das vorher vielleicht nur von Ramen-Nudeln gelebt hat.

Allerdings sind nicht alle Ligen gleich. Die finanziellen Unterschiede zwischen ihnen sind erheblich. Die Championship hat im gleichen Jahr etwa 890 Millionen Dollar gemacht, während League One und League Two jeweils 280 Millionen und 156 Millionen Dollar einbrachten. Diese Unterschiede schaffen einen sehr intensiven Wettbewerb in allen Stufen des englischen Vereinsfussballs. Jeder will ganz oben stehen!

Die Schwierigkeit, Ergebnisse vorherzusagen

Trotz der Aufregung und des Wettbewerbs ist es nicht so einfach, die Ergebnisse dieser Spiele vorherzusagen, wie eine Münze zu werfen. Tatsächlich stellt sich heraus, dass es in den unteren Ligen generell schwieriger ist, Spiele vorherzusagen als in der hochfliegenden Premier League. Das liegt daran, dass die weniger bekannten Teams ein bisschen unberechenbar sein können. Wenn wir jedoch die Teams entfernen, die in ihren Ligen konstant dominieren, stellt sich heraus, dass die Vorhersage der Premier League genauso knifflig sein kann wie die unteren Ligen.

Frühere Forschung und Datenbeschränkungen

Trotz der Fülle an Daten über die englischen Fussballligen wurde nicht viel Forschung zu den unteren Ligen betrieben. Die meisten Studien konzentrieren sich auf die obersten Ligen und lassen die unteren Ebenen im Dunkeln. Ein Beispiel für jemanden, der es versucht hat, ist Artzen und Hvattum, die das Elo-Bewertungssystem verwendet haben, um Spielergebnisse in unteren Ligen vorherzusagen. Traditionelle mathematische Modelle, wie sie von Massey und Colley erstellt wurden, wurden in diesen unteren Ligen jedoch noch nicht umfassend untersucht.

Die Rolle der Spielerbewertungen

Um uns bei unseren Vorhersagen zu helfen, haben wir uns die Spielerbewertungen von Transfermarkt angesehen, einer Seite, auf der Fans über den Wert von Spielern diskutieren. Es ist wie ein schickes Online-Basar, wo Fussballbegeisterte feilschen, wer was wert ist. Dieser crowdsourced Ansatz zur Bestimmung von Spielerwerten ist bei Scouts und Vereinsmanagern ziemlich beliebt, was ihm einen gewissen Strassenruf verleiht.

Wir wollten herausfinden, ob diese Bewertungen uns helfen könnten, die Ergebnisse von Spielen in unteren Ligen vorherzusagen. Die Idee ist, dass wenn Fans über Spielerwerte sprechen, sie vielleicht auf etwas stossen, wenn sie vorhersagen, wie Teams abschneiden werden. Schliesslich könnte ein hoch bewerteter Spieler ein bisschen mehr Talent aufs Feld bringen.

Der Aufbau unserer Studie

In unserer Forschung haben wir uns vorgenommen, verschiedene mathematische Modelle zu vergleichen, um zu sehen, wie sie Ergebnisse auf verschiedenen Ebenen des englischen Fussballs vorhersagen können. Wir werden unsere Ergebnisse in Abschnitte unterteilen:

  1. Einführung in die Colley- und Massey-Rangmethoden: Wir geben einen Überblick über diese mathematischen Rangmethoden und warum sie nützlich sind.

  2. Daten und Metriken: Wir werden erläutern, wie wir unsere Daten gesammelt haben und welche Metriken wir verwendet haben, um unsere Modelle zu bewerten.

  3. Modellierungsansätze: Wir werden auf unsere verschiedenen Modellierungsmethoden eingehen, einschliesslich der Bewertungen von Transfermarkt.

  4. Analyse der Vorhersagen: Wir werden teilen, wie unsere Modelle im Vergleich zu tatsächlichen Spielergebnissen in englischen, deutschen und schottischen Ligen abgeschnitten haben.

  5. Schlussfolgerungen und zukünftige Richtungen: Schliesslich fassen wir zusammen, was unsere Ergebnisse bedeuten und wo es möglich ist, weitere Forschung zu betreiben.

Die Colley- und Massey-Rangmethoden

Die Colley- und Massey-Methoden sind zwei klassische Rangsysteme, die verwendet werden, um die Leistung von Sportteams zu bewerten. Beide Methoden nutzen Statistiken aus vergangenen Spielen, aber sie gehen unterschiedlich mit den Daten um.

Die Colley-Methode konzentriert sich auf den Gewinnprozentsatz und die Stärke der gespielten Teams. Es ist, als würde man versuchen herauszufinden, wie gut ein Team ist, indem man nicht nur betrachtet, wie viele Spiele sie gewonnen haben, sondern auch gegen wen sie gespielt haben. Wenn ein Team einen hohen Gewinnprozentsatz hat, aber schwache Gegner hatte, könnte ihre Rangliste nicht so hoch sein.

Die Massey-Methode hingegen verwendet den Punktunterschied in Spielen. Diese Methode geht davon aus, dass die Stärke der Teams das Endergebnis eines Spiels beeinflusst. Wenn Team A Team B mit einem grossen Vorsprung besiegt, können wir ableiten, dass Team A stärker ist.

Datensammlung und Metriken

Unsere Studie beinhaltete die Sammlung von Daten aus verschiedenen Ligen über mehrere Jahre. Wir haben Spielergebnisse, Teamaufstellungen und Spielerbewertungen von Transfermarkt gesammelt, die wie ein Schatz voller Fussballstatistiken sind.

Wir konzentrierten uns auf die oberen vier Ebenen des englischen Fussballligasystems sowie auf Daten aus einigen deutschen und schottischen Ligen. Ziel war es, einen soliden Datensatz zusammenzustellen, den wir verwenden konnten, um unsere Vorhersagemodelle zu testen.

Modellierungsansätze

Wir haben ein paar verschiedene Modelle getestet. Zuerst verwendeten wir die klassischen Colley- und Massey-Rankings für sich. Dann haben wir einige Anpassungen vorgenommen, wie zum Beispiel den Heimvorteil und die Spielerbewertungen von Transfermarkt, um zu sehen, ob diese Faktoren unsere Vorhersagen verbessern könnten.

Für unser Wettquotenmodell haben wir auf die Weisheit der Wettwelt zurückgegriffen. Buchmacher wissen, was sie tun, und haben ein gutes Gespür dafür, Ergebnisse vorherzusagen, also dachten wir, es wäre schlau, unsere Modelle mit ihren Quoten zu vergleichen.

Analyse unserer Vorhersagen

Sobald wir unsere Modelle aufgestellt hatten, haben wir bewertet, wie gut sie abgeschnitten haben, indem wir ihre Vorhersagen mit den tatsächlichen Spielergebnissen verglichen haben. Wir fokussierten uns auf Metriken wie Ranggenauigkeit und Spielresultatvorhersagen.

Unsere Modelle zeigten interessante Muster. Die Vorhersagen für Premier-League-Spiele erwiesen sich als genauer als die für untere Ligen. Aber als wir Spiele mit Top-Teams herausnahmen, wurden die Unterschiede in der Genauigkeit zwischen den Ligen weniger ausgeprägt.

Der Einfluss dominanter Teams

Unsere Ergebnisse haben das signifikante Einfluss von dominanten Teams ans Licht gebracht, die oft als die „Big Six“ in der Premier League bezeichnet werden. Diese Teams haben historisch besser abgeschnitten und verzerren die Vorhersagen zu ihren Gunsten.

Wir haben die Modelle erneut durchlaufen lassen, diesmal ohne Spiele mit diesen dominanten Teams. Überraschenderweise brachte das unsere Vorhersagefähigkeiten näher an die der unteren Ligen! Es scheint, dass die Dominanz von wenigen Teams die Vorhersage komplizierter machen kann, als sie sein müsste.

Erkenntnisse aus anderen Ligen

Um unser Verständnis zu erweitern, haben wir auch die Modelle mit Daten aus den deutschen und schottischen Ligen bewertet. Während diese Ligen ihre Eigenheiten haben, stimmten unsere Ergebnisse im Allgemeinen mit dem überein, was wir in den englischen Ligen entdeckt haben. Die Modelle schnitten in den obersten Ligen besser ab als in den unteren Ligen insgesamt.

Marktbewertungen und die Weisheit der Masse

Das Konzept der „Weisheit der Masse“ legt nahe, dass eine grössere Gruppe oft zu einer genaueren Schlussfolgerung kommt als eine Einzelperson oder eine kleine Gruppe. In unserem Fall, wenn die Masse in der Lage ist, Spieler auf Transfermarkt effektiv zu bewerten, sollten ihre Einsichten die Vorhersagen verbessern, oder? Nun, ein bisschen.

Während wir fanden, dass die Bewertungen von Transfermarkt eine gewisse Vorhersagekraft hatten, übertrafen sie nicht unbedingt traditionelle Methoden, wenn es um Vereinsfussball ging. Das wirft die Frage auf: Ist Crowdsourcing wirklich so gut, wie es klingt? Vielleicht werfen die Leute, die über Spielerwerte reden, einfach Darts auf eine Zielscheibe.

Fazit und zukünftige Richtungen

Zusammenfassend zeigt unsere Forschung, dass verschiedene mathematische Modelle helfen können, Fussballspielergebnisse vorherzusagen, aber ihre Wirksamkeit variiert zwischen den Ligen. Während die Modelle in der Premier League gut abschnitten, hatten sie Probleme mit unteren Ligen, insbesondere wenn dominante Teams im Spiel waren.

In Zukunft sehen wir viel Raum für Verbesserungen. Es gibt Potenzial, die Modelle zu verfeinern, indem man besser auf Spiele eingeht, die unentschieden enden, oder zusätzliche Metriken wie Spielerstatistiken einbezieht. Die Erkundung der Auswirkungen dominanter Teams auf den Wettbewerbsgleichgewicht könnte ebenfalls wertvolle Einblicke bieten.

Mit der globalen Beliebtheit des Fussballs gibt es keinen Mangel an Daten, die man untersuchen kann. Also schnapp dir deinen Lieblingssnack und mach's dir bequem, denn die Welt der Fussballanalytik steckt gerade erst in den Kinderschuhen!

Originalquelle

Titel: Predictive Modeling of Lower-Level English Club Soccer Using Crowd-Sourced Player Valuations

Zusammenfassung: In this research, we examine the capabilities of different mathematical models to accurately predict various levels of the English football pyramid. Existing work has largely focused on top-level play in European leagues; however, our work analyzes teams throughout the entire English Football League system. We modeled team performance using weighted Colley and Massey ranking methods which incorporate player valuations from the widely-used website Transfermarkt to predict game outcomes. Our initial analysis found that lower leagues are more difficult to forecast in general. Yet, after removing dominant outlier teams from the analysis, we found that top leagues were just as difficult to predict as lower leagues. We also extended our findings using data from multiple German and Scottish leagues. Finally, we discuss reasons to doubt attributing Transfermarkt's predictive value to wisdom of the crowd.

Autoren: Josh Brown, Yutong Bu, Zachary Cheesman, Benjamin Orman, Iris Horng, Samuel Thomas, Amanda Harsy, Adam Schultze

Letzte Aktualisierung: 2024-11-13 00:00:00

Sprache: English

Quell-URL: https://arxiv.org/abs/2411.09085

Quell-PDF: https://arxiv.org/pdf/2411.09085

Lizenz: https://creativecommons.org/licenses/by/4.0/

Änderungen: Diese Zusammenfassung wurde mit Unterstützung von AI erstellt und kann Ungenauigkeiten enthalten. Genaue Informationen entnehmen Sie bitte den hier verlinkten Originaldokumenten.

Vielen Dank an arxiv für die Nutzung seiner Open-Access-Interoperabilität.

Mehr von den Autoren

Ähnliche Artikel