Os algoritmos de aprendizado de máquina podem prever resultados ou jogadas esportivas?


40

Eu tenho uma variedade de conjuntos de dados da NFL que acho que podem ser um bom projeto paralelo, mas ainda não fiz nada com eles.

Ir a este site me fez pensar em algoritmos de aprendizado de máquina e me pergunto o quanto eles podem ser bons em prever o resultado de jogos de futebol ou até a próxima jogada.

Parece-me que haveria algumas tendências que poderiam ser identificadas - no 3º para baixo e 1, uma equipe com um forte back running teoricamente deveria ter uma tendência a rodar a bola nessa situação.

A pontuação pode ser mais difícil de prever, mas a equipe vencedora pode ser.

Minha pergunta é se estas são boas perguntas para lançar em um algoritmo de aprendizado de máquina. Pode ser que milhares de pessoas tenham tentado isso antes, mas a natureza do esporte o torna um tópico não confiável.

Respostas:


18

Existem muitas perguntas boas sobre futebol (e esportes, em geral) que seriam incríveis para serem lançadas em um algoritmo e ver o que sai. A parte complicada é saber o que jogar no algoritmo.

Uma equipe com uma boa RB poderia simplesmente passar o terceiro e o short apenas porque os adversários provavelmente esperariam correr, por exemplo. Então, para realmente produzir alguns resultados dignos, eu quebrava o problema em pedaços menores e os analisava estatisticamente enquanto os jogava nas máquinas.

Existem alguns sites (bons) que tentam fazer o mesmo, você deve dar uma olhada neles e usar o que encontraram para ajudá-lo:

E se você realmente deseja explorar a Análise de Dados Esportivos, definitivamente deve conferir os vídeos da Sloan Sports Conference . Há muitos deles espalhados no Youtube.


13

Sim. Por que não?! Com tantos dados sendo registrados em cada esporte em cada jogo, o uso inteligente de dados pode nos levar a obter informações importantes sobre o desempenho do jogador.

Alguns exemplos:

Portanto, sim, a análise estatística dos registros dos jogadores pode nos dar informações sobre quais jogadores têm maior probabilidade de desempenho, mas não quais serão . Portanto, o aprendizado de máquina, um primo próximo da análise estatística estará provando ser um divisor de águas.


9

Definitivamente eles podem. Posso direcioná-lo para um bom papel . Uma vez eu o usei para a implementação de algoritmos de previsão de resultados de ligas de futebol, visando principalmente ter algum valor contra as casas de apostas.

Do resumo do artigo:

um modelo generalizado dinâmico bayesiano para estimar as habilidades dependentes do tempo de todas as equipes de uma liga e prever as partidas de futebol do próximo fim de semana.

Palavras-chave:

Modelos dinâmicos, modelos lineares generalizados, modelos gráficos, métodos de Monte Carlo em cadeia de Markov, previsão de partidas de futebol

Citação:

Rue, Havard e Oyvind Salvesen. "Previsão e análise retrospectiva de partidas de futebol em uma liga". Jornal da Sociedade Estatística Real: Série D (The Statistician) 49.3 (2000): 399-418.


7

O aprendizado de máquina e as técnicas estatísticas podem melhorar a previsão, mas ninguém pode prever o resultado real.

Há alguns meses, houve uma competição de kaggle sobre a previsão do torneio da NCAA de 2014 . Você pode ler o Fórum da Concorrência para ter uma idéia melhor do que as pessoas fizeram e dos resultados alcançados.


7

Foi demonstrado antes que as técnicas de aprendizado de máquina podem ser aplicadas para prever resultados esportivos. A simples pesquisa no Google deve fornecer vários resultados.

No entanto, também foi demonstrado (para a NFL btw) que modelos preditivos muito complexos, modelos preditivos simples, pessoas questionadoras ou conhecimento da multidão utilizando informações de apostas, todos eles têm mais ou menos o mesmo desempenho. Fonte: " Tudo fica óbvio quando você sabe a resposta - Como o bom senso falha ", capítulo 7, de Duncan Watts.


Interessante. A razão pela qual fiz a pergunta é que me perguntei se algo semelhante à "falácia do jogador" (ou mesmo ao próprio GF). Eu pensei que poderia haver uma chance de já ter sido provado ser um empreendimento infrutífero. Ainda assim - essas outras respostas são intrigantes.
Steve Kallestad

6

Michael Maouboussin, em seu livro "The Success Equation", analisa a diferença entre sorte e habilidade em vários empreendimentos, incluindo esportes. Na verdade, ele classifica os esportes pela quantidade de sorte que contribui para o desempenho nos diferentes esportes (p. 23) e cerca de 2/3 do desempenho no futebol é atribuível à habilidade. Por outro lado, usei a técnica da MM para analisar o desempenho nas corridas de Fórmula 1 e descobri que 60% são atribuíveis à habilidade (menos do que eu esperava).

Dito isso, parece que esse tipo de análise implicaria que um conjunto de recursos suficientemente detalhados e criados permitiria aos algoritmos de ML prever o desempenho das equipes da NFL, talvez até no nível de jogo, com a ressalva de que ainda haverá variação significativa por causa da influência de sorte no jogo.




5

Eles não podem prever, mas podem dizer o resultado mais provável. Há um estudo sobre esse tipo de abordagem de Etienne - Prever quem vencerá a Copa do Mundo com a Wolfram Language . Este é um estudo muito detalhado, para que você possa verificar toda a metodologia usada para obter as previsões.

Interessante o suficiente, 11 de 15 partidas estavam corretas!

Como seria de esperar, o Brasil é o favorito, com uma probabilidade de vitória de 42,5%. Esse resultado impressionante deve-se ao fato de o Brasil ter o maior ranking Elo e jogar em casa.

(Vamos para o Brasil!)


3

Muitas pessoas enfatizaram quais são as coisas que podem ser previstas em suas respostas. Agora, com o fascínio pela aprendizagem profunda, você pode, por exemplo, usar as RNNs (por exemplo, LSTM) para prever resultados para problemas esportivos baseados no tempo. Estes são o estado da arte e superam os modelos tradicionais.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.