Espero poder fazer esta pergunta da maneira correta. Eu tenho acesso aos dados play-by-play, por isso é mais um problema com a melhor abordagem e a construção correta dos dados.
O que pretendo fazer é calcular a probabilidade de ganhar um jogo da NHL, considerando a pontuação e o tempo restante na regulamentação. Eu acho que poderia usar uma regressão logística, mas não tenho certeza de como deve ser o conjunto de dados. Eu teria várias observações por jogo e a cada fatia de tempo que me interessa? Eu teria uma observação por jogo e caberia modelos separados por uma fatia de tempo? A regressão logística é o caminho certo a seguir?
Qualquer ajuda que você puder fornecer será muito apreciada!
Cumprimentos.