Simple Science

最先端の科学をわかりやすく解説

# 統計学 # アプリケーション

イギリスのサッカー予測を理解する

サッカーの試合結果をいろんなリーグで予測することについての見解。

Josh Brown, Yutong Bu, Zachary Cheesman, Benjamin Orman, Iris Horng, Samuel Thomas, Amanda Harsy, Adam Schultze

― 1 分で読む


サッカーの試合結果を予測す サッカーの試合結果を予測す 方法の分析。 イングランドのサッカーリーグにおける予測
目次

サッカー、もしくはフットボールって呼ぶ人もいるけど、イングランドでは長い歴史があるんだ。1863年に公式ルールが定められて、世界で最も古い組織的スポーツの一つになったんだよ。年月が経つにつれて、ゲームは発展して、イングランド・フットボール・ピラミッドって呼ばれるちゃんとしたリーグシステムができた。このピラミッドの頂点には、イングランド・プレミアリーグ(EPL)があって、イングランドだけじゃなくて世界中のフットボールリーグの中で最高峰なんだ!EPLはでっかいお金が動く場所で、2022-2023シーズンにはなんと69億ドルの収益を上げたんだよ。それって町の一番のショーのプレミアム席に座ってるようなもので、イングランド・チャンピオンシップやリーグワン、リーグツーなどはテーブルから落ちたクズを拾ってる感じなんだ。

階層的リーグシステム

このフットボールピラミッドはユニークで、昇格と降格のシステムがあって、ちょっと音楽椅子ゲームみたいなんだ。リーグでうまくやれば、上の階層に昇格できるし、悪ければ降格しちゃうかも。例えば、リーグツーからプレミアリーグに上がるチームは、収益が3年間で少なくとも1億6000万ドルも伸びることがあるんだ!それって、以前はラーメン生活してたチームにとってはいい稼ぎだよね。

でも、すべてのリーグが平等ってわけじゃない。リーグ間の財政的な差はかなり大きい。チャンピオンシップは同じ年に890百万ドルを稼いで、リーグワンとリーグツーはそれぞれ280百万ドルと156百万ドルだったんだ。こういう違いが、イングランドのクラブサッカーのすべての階層で激しい競争を生んでる。みんなトップに立ちたいんだから!

結果の予測の難しさ

興奮と競争がある一方で、試合の結果を予測するのはコインをひっくり返すほど簡単じゃないんだ。実際、下位リーグのゲームを予測するのは、プレミアリーグよりも難しいことが多い。知名度が低いチームはちょっと予測不可能だからね。でも、リーグ内で常に優位に立っているチームを除外すると、プレミアリーグの予測も下位リーグと同じくらい難しくなることがわかるんだ。

以前の研究とデータの制限

イングランドのフットボールリーグに関するデータはたくさんあるけど、下位リーグについての研究はあまり進んでいないんだ。ほとんどの研究は上位リーグに焦点を当てているから、下位リーグは置いてけぼりにされちゃってる。なんとか試みた人の一人がアーツェンとフヴァットムで、彼らはElo評価システムを使って下位リーグの試合結果を予測したんだ。ただ、マッセイやコリーが作った従来の数学モデルは、下位リーグではまだ十分に探求されていないみたい。

プレイヤー評価の役割

予測を手助けするために、私たちはTransfermarktからのプレイヤー評価を使ったんだ。これはファンが選手の価値を語り合うサイトで、サッカー好きが誰がいくら価値があるかを交渉する高級オンラインバザールみたいなものなんだ。このクラウドソーシング的なアプローチはスカウトやクラブの幹部たちの間で人気があって、ちょっとしたストリートクレジットがあるんだ。

私たちは、これらの評価が下位リーグの試合結果を予測するのに役立つかどうかを確認することにしたんだ。ファンが選手の価値について話しているなら、チームのパフォーマンスを予測するのに何か手がかりを得られるかもしれないからね。結局、選手が高く評価されているなら、フィールドにもっとタレントをもたらすかもしれないし。

研究の構造

私たちの研究では、さまざまな数学モデルを比較して、イングランドのサッカーシステムの異なるレベルで結果を予測できるかどうかを調べることにしたんだ。結果を以下のセクションに分ける予定だよ:

  1. コリーとマッセイのランキング手法の紹介: これらの数学的ランキング手法の背景とその有用性について説明するよ。

  2. データとメトリック: データの収集方法とモデル評価に使用したメトリックについて説明するよ。

  3. モデリングアプローチ: Transfermarktの評価を含めた私たちの異なるモデリング手法を詳しく掘り下げるよ。

  4. 予測の分析: 私たちのモデルがイングランド、ドイツ、スコットランドのリーグでの実際の試合結果に対してどのように機能したかを共有するよ。

  5. 結論と今後の方向性: 最後に、私たちの発見が何を意味するのか、さらなる研究の可能性についてまとめるよ。

コリーとマッセイのランキング手法

コリーとマッセイの手法は、スポーツチームのパフォーマンスを評価するための古典的なランキングシステムだよ。どちらの手法も過去の試合の統計を利用するけど、データへのアプローチが異なるんだ。

コリーの手法は勝率と対戦チームの強さに焦点を当てているんだ。勝った試合数だけでなく、誰と対戦したかも考慮に入れて、そのチームの良さを判断するような感じだよ。もしチームの勝率が高くても、弱い相手とばかり戦っていたら、ランキングはそれほど高くならないかもしれない。

一方、マッセイの手法は試合のポイント差を使うんだ。この手法は、チームの強さが試合の最終スコアに影響を与えるという前提に基づいているよ。例えば、チームAがチームBを大差で倒した場合、チームAの方が強いと推測できるんだ。

データ収集とメトリック

私たちの研究では、さまざまなリーグから数年にわたってデータを集めることにしたんだ。試合の結果、チームのロースター、Transfermarktからのプレイヤー評価をキャッチしたんだ。これはサッカー統計の宝の山みたいなもんだよ。

イングランドのフットボールリーグシステムのトップ4階層に焦点を当てて、ドイツやスコットランドのリーグのデータも集めたんだ。目標は、予測モデルをテストするためのしっかりしたデータセットを作ることだったんだ。

モデリングアプローチ

いくつかの異なるモデルをテストしたよ。まず、コリーとマッセイのランキングをそれぞれ単独で使用したんだ。それから、ホームフィールドアドバンテージやTransfermarktからのプレイヤー評価を加えて、これらの要素が予測を改善できるかを見てみたよ。

ベッティングオッズモデルでは、ベッティング業界の知恵に頼ったんだ。ブックメーカーはやっぱり勘が良くて、結果を予測するのが得意だから、私たちのモデルを彼らのオッズと比較するのは賢い選択だと思ったんだ。

予測の分析

モデルが整ったら、実際の試合結果と比較してどれくらいうまく機能したかを評価したんだ。ランキングの精度や試合結果の予測などのメトリックに焦点を当てたよ。

私たちのモデルは面白いパターンを示したよ。プレミアリーグの試合に対する予測は、下位リーグのものよりも正確だったんだ。でも、トップチームが絡む試合を除外すると、リーグ間の精度の違いはあまり目立たなくなってきたんだ。

支配的なチームの影響

私たちの発見は、プレミアリーグの「ビッグシックス」と呼ばれる支配的なチームが予測モデルに与える大きな影響を明らかにしたよ。これらのチームは歴史的に良い成果を上げていて、予測を有利に傾けるんだ。

再度モデルを回してみたら、今回はこれらの支配的なチームが絡む試合を除外したんだ。驚くことに、これが私たちの予測能力を下位リーグのそれに近づけたんだ!数チームの支配が予測を複雑にしているみたいだね。

他のリーグからの洞察

理解を深めるために、ドイツとスコットランドのリーグのデータを使ってモデルを評価したよ。これらのリーグには独自の特徴があるけど、私たちの発見は一般的にイングランドのリーグでの結果と一致していたんだ。モデルは上位リーグの方が下位リーグよりも良いパフォーマンスを示したよ。

市場評価と群衆の知恵

「群衆の知恵」というコンセプトは、大きなグループが個人や小グループよりも正確な結論に達することが多いということを示しているよ。私たちの場合、もし群衆がTransfermarktで選手を効果的に評価できているなら、その洞察が予測を改善するはずだよね?でも、ちょっと違ったみたい。

Transfermarktの評価は多少の予測力を提供してくれたけど、クラブサッカーに関しては従来の手法を上回るわけではなかったんだ。これって、クラウドソーシングは本当にそんなに素晴らしいの?もしかしたら、選手の価値について話している人たちは、結局ボードにダーツを投げてるだけなのかもしれないね。

結論と今後の方向性

要するに、私たちの研究はさまざまな数学モデルがサッカーの試合結果を予測するのに役立つことを示しているけど、その効果はリーグによって異なるんだ。モデルはプレミアリーグではうまく機能したけど、下位リーグでは苦戦したし、特に支配的チームが絡む試合では難しかったんだ。

今後は改善の余地がたくさんあると思ってる。引き分けで終わる試合をよりよく考慮したり、選手の統計のような追加のメトリックを組み込むことでモデルを洗練させる余地があるよ。支配的なチームが競争バランスに与える影響を探求するのも、貴重な洞察を提供するかもしれないね。

サッカーの世界的な人気を考えると、掘り下げるデータは尽きることがないから。だから、好きなおやつを用意して、リラックスしてね!サッカー分析の世界はこれからが始まりなんだから!

オリジナルソース

タイトル: Predictive Modeling of Lower-Level English Club Soccer Using Crowd-Sourced Player Valuations

概要: In this research, we examine the capabilities of different mathematical models to accurately predict various levels of the English football pyramid. Existing work has largely focused on top-level play in European leagues; however, our work analyzes teams throughout the entire English Football League system. We modeled team performance using weighted Colley and Massey ranking methods which incorporate player valuations from the widely-used website Transfermarkt to predict game outcomes. Our initial analysis found that lower leagues are more difficult to forecast in general. Yet, after removing dominant outlier teams from the analysis, we found that top leagues were just as difficult to predict as lower leagues. We also extended our findings using data from multiple German and Scottish leagues. Finally, we discuss reasons to doubt attributing Transfermarkt's predictive value to wisdom of the crowd.

著者: Josh Brown, Yutong Bu, Zachary Cheesman, Benjamin Orman, Iris Horng, Samuel Thomas, Amanda Harsy, Adam Schultze

最終更新: 2024-11-13 00:00:00

言語: English

ソースURL: https://arxiv.org/abs/2411.09085

ソースPDF: https://arxiv.org/pdf/2411.09085

ライセンス: https://creativecommons.org/licenses/by/4.0/

変更点: この要約はAIの助けを借りて作成されており、不正確な場合があります。正確な情報については、ここにリンクされている元のソース文書を参照してください。

オープンアクセスの相互運用性を利用させていただいた arxiv に感謝します。

著者たちからもっと読む

類似の記事

機械学習 サッカーのカウンターアタック分析:データ駆動型アプローチ

この研究では、高度なデータ分析を通じてサッカーにおける成功するカウンターアタックを探ってるよ。

Joris Bekkers, Amod Sahasrabudhe

― 1 分で読む

コンピュータ科学とゲーム理論 学習エージェントを使ったオークションのダイナミクス

学習エージェントがオークション戦略や収益結果にどんな影響を与えるかを探ってみて。

Gagan Aggarwal, Anupam Gupta, Andres Perlroth

― 0 分で読む