Me ajude aqui, por favor. Talvez antes mesmo de me dar uma resposta, você precise me ajudar a fazer a pergunta. Eu nunca aprendi sobre análise de séries temporais e não sei se é de fato o que eu preciso. Eu nunca aprendi sobre as médias suavizadas pelo tempo e não sei se é realmente isso que eu preciso. Meu histórico estatístico: tenho 12 créditos em bioestatística (regressão linear múltipla, regressão logística múltipla, análise de sobrevivência, anova multifatorial, mas nunca anote medidas repetidas).
Então, por favor, veja meus cenários abaixo. Quais são as palavras-chave que devo procurar e você pode sugerir um recurso para aprender o que preciso aprender?
Quero examinar vários conjuntos de dados diferentes para propósitos totalmente diferentes, mas comum a todos eles é que há datas como uma variável. Portanto, alguns exemplos vêm à mente: produtividade clínica ao longo do tempo (como em quantas cirurgias ou quantas visitas ao consultório) ou conta de energia elétrica ao longo do tempo (como em dinheiro pago à empresa de eletricidade por mês).
Nas duas situações acima, a maneira quase universal de fazer isso é criar uma planilha de mês ou trimestre em uma coluna e na outra coluna haveria algo como pagamento de eletricidade ou número de pacientes atendidos na clínica. No entanto, a contagem por mês gera muito barulho que não tem significado. Por exemplo, se eu normalmente pago a conta de eletricidade no dia 28 de cada mês, mas em uma ocasião eu esqueço e só a pago 5 dias depois no dia 3 do próximo mês, um mês aparecerá como se não houvesse despesas e o próximo mês mostrará despesas gigantescas. Como se tem as datas de pagamento reais, por que alguém descartaria propositadamente os dados muito granulares colocando-os em despesas por mês?
Da mesma forma, se eu estiver fora da cidade por 6 dias em uma conferência, esse mês parecerá muito improdutivo e se esses 6 dias caírem perto do final do mês, o próximo mês ficará incomumente ocupado, pois haverá uma lista de espera inteira de pessoas que queriam me ver, mas tiveram que esperar até eu voltar.
Então, é claro, existem as variações sazonais óbvias. Os aparelhos de ar condicionado usam muita eletricidade; portanto, é necessário ajustar o calor do verão. Bilhões de crianças são encaminhadas a mim por otite média aguda recorrente no inverno e quase nenhuma no verão e no início do outono. Nenhuma criança em idade escolar é programada para cirurgia eletiva nas primeiras 6 semanas em que as escolas retornam após as longas férias de verão. A sazonalidade é apenas uma variável independente que afeta a variável dependente. Deve haver outras variáveis independentes, algumas das quais podem ser adivinhadas e outras que não são conhecidas.
Um monte de questões diferentes surgem quando se olha para a inscrição em um estudo clínico de longa data.
Que ramo das estatísticas nos permite analisar isso ao longo do tempo, simplesmente observando os eventos e suas datas reais, mas sem criar caixas artificiais (meses / trimestres / anos) que realmente não existem.
Pensei em fazer a média ponderada contar para qualquer evento. Por exemplo, o número de pacientes atendidos nesta semana é igual a 0,5 * n atendido nesta semana + 0,25 * n atendido na semana passada + 0,25 * n atendido na próxima semana.
Eu quero aprender mais sobre isso. Quais chavões devo procurar?