Simple Science

Ciência de ponta explicada de forma simples

# Estatística # Aplicações

Entendendo as Previsões de Futebol na Inglaterra

Uma olhada em prever os resultados de jogos de futebol em diferentes ligas.

Josh Brown, Yutong Bu, Zachary Cheesman, Benjamin Orman, Iris Horng, Samuel Thomas, Amanda Harsy, Adam Schultze

― 9 min ler


Prevendo Resultados de Prevendo Resultados de Jogos de Futebol ligas de futebol inglês. Analisando métodos de previsão nas
Índice

O futebol, ou como alguns chamam, o soccer, tem uma longa história na Inglaterra. As regras oficiais do esporte foram definidas em 1863, tornando-se um dos esportes organizados mais antigos. Com o passar dos anos, o jogo cresceu e se desenvolveu em um sistema de ligas super estruturado conhecido como o "piramide do futebol inglês". No topo dessa pirâmide tá a Premier League (EPL), a nata das ligas de futebol, não só na Inglaterra, mas no mundo todo! A EPL é onde rolam as grana; durante a temporada 2022-2023, gerou nada menos que $6,9 bilhões em receita. Isso é tipo ter um lugar premium para assistir ao maior show da cidade, enquanto ligas como o Championship, League One e League Two ficam só pegando as migalhas da mesa.

O Sistema de Ligas em Níveis

Essa pirâmide do futebol é única porque oferece um sistema de promoção e rebaixamento, um pouco como um jogo de cadeiras musicais. Se você manda bem na sua liga, você é promovido para um nível mais alto, e se você vai mal, bem, pode acabar caindo um nível. Por exemplo, um time que consegue subir da League Two para a Premier League pode ver um aumento enorme na sua receita - pelo menos $160 milhões em três anos! Isso é uma grana boa para um time que antes tava vivendo de miojo.

Mas, nem todas as ligas são iguais. As diferenças financeiras entre elas são bem grandes. O Championship fez cerca de $890 milhões no mesmo ano, enquanto League One e League Two arrecadaram $280 milhões e $156 milhões, respectivamente. Essas diferenças criam uma competição super intensa em todos os níveis do futebol de clubes inglês. Todo mundo quer ser o melhor!

A Dificuldade de Prever Resultados

Apesar da empolgação e da competição, prever os resultados desses jogos não é tão fácil quanto jogar uma moeda. Na verdade, parece que prever jogos nas ligas menores é geralmente mais difícil do que na Premier League. Isso porque os Times menos conhecidos podem ser um pouco imprevisíveis. Porém, quando tiramos os times que dominam suas ligas, descobrimos que prever a Premier League pode ser tão complicado quanto as ligas inferiores.

Pesquisas Anteriores e Limitações de Dados

Apesar da abundância de dados disponíveis sobre as ligas de futebol inglês, não foram feitas muitas pesquisas sobre as ligas de nível mais baixo. A maioria dos estudos foca nas ligas de elite, deixando os níveis inferiores na penumbra. Um exemplo de quem tentou isso foi Artzen e Hvattum, que usaram o sistema de classificação Elo para prever resultados de jogos nas ligas menores. No entanto, modelos matemáticos tradicionais, como os criados por Massey e Colley, não foram explorados totalmente nessas ligas inferiores.

O Papel das Avaliações de Jogadores

Para nos ajudar nas previsões, fomos atrás das avaliações de jogadores do Transfermarkt, um site onde os fãs discutem o valor dos jogadores. É como um bazar online chique onde os entusiastas do futebol negociam sobre quem vale o quê. Essa abordagem em grupo para determinar os valores dos jogadores é bem popular entre olheiros e executivos de clubes, dando um certo prestígio.

Decidimos ver se essas avaliações poderiam ajudar a prever os resultados de jogos nas ligas menores. A ideia é que, se os fãs estão falando sobre os valores dos jogadores, eles podem estar certos em prever como os times vão se comportar. Afinal, se um jogador é muito valorizado, ele pode trazer um pouco mais de talento para o campo.

A Estrutura do Nosso Estudo

Na nossa pesquisa, nos propusemos a comparar diferentes modelos matemáticos para ver como eles podem prever resultados em vários níveis do sistema de futebol inglês. Vamos dividir nossas descobertas em seções:

  1. Introdução aos Métodos de Classificação Colley e Massey: Vamos dar uma introdução sobre esses métodos de classificação matemática e por que eles são úteis.

  2. Dados e Métricas: Vamos cobrir como coletamos nossos dados e quais métricas usamos para avaliar nossos modelos.

  3. Abordagens de Modelagem: Vamos explorar nossos diferentes métodos de modelagem, incluindo as avaliações do Transfermarkt.

  4. Análise das Previsões: Vamos compartilhar como nossos modelos se saíram em relação aos resultados reais dos jogos nas ligas inglesa, alemã e escocesa.

  5. Conclusões e Direções Futuras: Finalmente, vamos concluir o que nossas descobertas significam e áreas potenciais para futuras pesquisas.

Os Métodos de Classificação Colley e Massey

Os métodos Colley e Massey são dois sistemas clássicos de classificação usados para avaliar o desempenho de times esportivos. Ambos os métodos usam estatísticas de jogos passados, mas abordam os dados de maneiras diferentes.

O método Colley se concentra na porcentagem de vitórias e na força dos times jogados. É como tentar descobrir quão bom um time é considerando não apenas quantos jogos eles ganharam, mas também contra quem eles jogaram. Se um time tem uma alta porcentagem de vitórias, mas enfrentou adversários fracos, sua classificação pode não ser tão alta.

Por outro lado, o método Massey usa a diferença de pontos nos jogos. Esse método assume que a força dos times afeta o resultado final de uma partida. Por exemplo, se o Time A vence o Time B por uma grande margem, podemos inferir que o Time A é mais forte.

Coleta de Dados e Métricas

Nosso estudo envolveu coletar uma porção de dados de várias ligas ao longo de vários anos. Pegamos resultados de jogos, elencos de times e avaliações de jogadores do Transfermarkt, que é como um cofre de estatísticas de futebol.

Focamos nos quatro primeiros níveis do sistema de ligas de futebol inglês, além de dados de algumas ligas alemãs e escocesas. O objetivo era compilar um conjunto de dados sólido que pudéssemos usar para testar nossos modelos preditivos.

Abordagens de Modelagem

Testamos alguns modelos diferentes. Primeiro, usamos as classificações clássicas Colley e Massey sozinhas. Depois, acrescentamos algumas novidades, como incluir a vantagem de jogar em casa e as avaliações de jogadores do Transfermarkt para ver se esses fatores poderiam melhorar nossas previsões.

Para nosso modelo de odds de apostas, confiamos na sabedoria do mundo das apostas. Os bookmakers sabem das coisas e têm um olhar afiado para prever resultados, então achamos que seria inteligente comparar nossos modelos com suas odds.

Analisando Nossas Previsões

Uma vez que tivemos nossos modelos prontos, avaliamos o quão bem eles se saíram comparando suas previsões com os resultados reais das partidas. Focamos em métricas como precisão nas classificações e previsões de resultados dos jogos.

Nossos modelos mostraram padrões interessantes. As previsões para os jogos da Premier League se mostraram mais precisas do que aquelas para as ligas inferiores. Mas, quando removemos jogos envolvendo os principais times, as diferenças de precisão entre as ligas se tornaram menos pronunciadas.

O Impacto dos Times Dominantes

Nossas descobertas trouxeram à tona o impacto significativo que times dominantes, frequentemente chamados de "Big Six" na Premier League, têm nos modelos de previsão. Esses times historicamente têm um desempenho melhor e distorcem as previsões a seu favor.

Rodamos os modelos novamente, desta vez excluindo quaisquer jogos que envolvessem esses times dominantes. Surpreendentemente, isso aproximou nossas habilidades preditivas das ligas inferiores! Parece que a dominação de alguns times pode complicar mais as previsões do que deveria.

Insights de Outras Ligas

Para ampliar nossa compreensão, também avaliamos os modelos usando dados das ligas alemãs e escocesas. Embora essas ligas tenham suas peculiaridades, nossas descobertas geralmente se alinharam ao que descobrimos nas ligas inglesas. Os modelos se saíram melhor nas ligas de elite em comparação com as ligas inferiores em geral.

Avaliações de Mercado e a Sabedoria da Multidão

O conceito de "sabedoria da multidão" sugere que um grupo maior frequentemente chega a uma conclusão mais precisa do que um indivíduo ou um pequeno grupo. No nosso caso, se a multidão pode avaliar jogadores efetivamente no Transfermarkt, suas percepções deveriam melhorar as previsões, certo? Bem, meio que.

Embora tenhamos descoberto que as avaliações do Transfermarkt ofereceram algum poder preditivo, elas não superaram necessariamente os métodos tradicionais quando se tratou de futebol de clubes. Isso levanta a questão: a coleta de dados realmente é tudo isso que falam? Talvez aquelas pessoas falando sobre valores de jogadores estejam apenas jogando dardos em um alvo no final das contas.

Conclusão e Direções Futuras

Em resumo, nossa pesquisa mostra que diferentes modelos matemáticos podem ajudar a prever os resultados de partidas de futebol, mas a eficácia varia entre as ligas. Embora os modelos tenham se saído bem na Premier League, eles tiveram dificuldades com as ligas inferiores, especialmente quando times dominantes estavam envolvidos.

Olhando para o futuro, vemos muito espaço para melhorias. Há potencial para refinarmos os modelos considerando melhor os jogos que terminam empatados ou incorporando métricas adicionais, como estatísticas de jogadores. Explorar os efeitos de times dominantes sobre o equilíbrio competitivo também poderia fornecer insights valiosos.

Com a popularidade global do futebol, não falta dados para analisarmos. Então, pegue seu lanche favorito e acomode-se, porque o mundo da análise de futebol está apenas começando!

Fonte original

Título: Predictive Modeling of Lower-Level English Club Soccer Using Crowd-Sourced Player Valuations

Resumo: In this research, we examine the capabilities of different mathematical models to accurately predict various levels of the English football pyramid. Existing work has largely focused on top-level play in European leagues; however, our work analyzes teams throughout the entire English Football League system. We modeled team performance using weighted Colley and Massey ranking methods which incorporate player valuations from the widely-used website Transfermarkt to predict game outcomes. Our initial analysis found that lower leagues are more difficult to forecast in general. Yet, after removing dominant outlier teams from the analysis, we found that top leagues were just as difficult to predict as lower leagues. We also extended our findings using data from multiple German and Scottish leagues. Finally, we discuss reasons to doubt attributing Transfermarkt's predictive value to wisdom of the crowd.

Autores: Josh Brown, Yutong Bu, Zachary Cheesman, Benjamin Orman, Iris Horng, Samuel Thomas, Amanda Harsy, Adam Schultze

Última atualização: 2024-11-13 00:00:00

Idioma: English

Fonte URL: https://arxiv.org/abs/2411.09085

Fonte PDF: https://arxiv.org/pdf/2411.09085

Licença: https://creativecommons.org/licenses/by/4.0/

Alterações: Este resumo foi elaborado com a assistência da AI e pode conter imprecisões. Para obter informações exactas, consulte os documentos originais ligados aqui.

Obrigado ao arxiv pela utilização da sua interoperabilidade de acesso aberto.

Mais de autores

Artigos semelhantes