Uma idéia subjacente no aprendizado estatístico é que você pode aprender repetindo um experimento. Por exemplo, podemos continuar lançando uma tachinha para saber a probabilidade de uma tachinha cair em sua cabeça.
No contexto de séries temporais, observamos uma única execução de um processo estocástico, em vez de repetidas execuções do processo estocástico. Observamos um experimento longo, em vez de vários experimentos independentes.
Precisamos de estacionariedade e ergodicidade, para que observar um longo processo de um processo estocástico seja semelhante a observar muitas execuções independentes de um processo estocástico.
Algumas definições (imprecisas)
Seja um espaço de amostra. Um processo estocástico é uma função do tempo e do resultado .Ω{Yt}t∈{1,2,3,…}ω∈Ω
- Para qualquer momento , é uma variável aleatória (ou seja, uma função de para algum espaço, como o espaço de números reais).tYtΩ
- Para qualquer resultado , temos é uma série determinísticaωX(ω){Y1(ω),Y2(ω),Y3(ω),…}
Uma questão fundamental em séries temporais
No Statistics 101, aprendemos sobre uma série de variáveis independentes e identicamente distribuídas , , etc ... Observamos vários experimentos idênticos onde um é aleatoriamente escolhido e isso nos permite aprender sobre variável aleatória . Pela Lei dos Grandes Números , temos convergindo quase certamente para .X1X2X3i=1,…,nωi∈ΩX1n∑ni=1XiE[X]
Uma diferença fundamental na configuração das séries temporais é que estamos observando várias observações ao longo do tempo vez de vários desenhos de .tΩ
No caso geral, pode não convergir para nada!1T∑Tt=1Yt
Para que várias observações ao longo do tempo realizem uma tarefa semelhante à de vários desenhos do espaço da amostra , precisamos de estacionariedade e ergodicidade .
Se existir uma média incondicional e as condições para o teorema ergódico forem satisfeitas, a série temporal da média da amostra convergirá para a média incondicional .E[Y]1T∑Tt=1YtE[Y]
Exemplo 1: falha de estacionariedade
Seja o processo degenerado . Podemos ver que não é estacionário (a distribuição conjunta não é invariante no tempo).{Yt}Yt=t{Yt}
Seja seja a média da amostra da série temporal, e é óbvio que não converge para algo como : . A média de não existe e não converge para nada como .St=1t∑ti=1YiStt→∞S1=1,S2=32,S3=2,…,St=t+12YtStt→∞
Exemplo: falha de ergodicidade
Seja o resultado de um único lançamento de moeda. Seja para todos os , isto é, ou .XYt=Xt{Yt}=(0,0,0,0,0,0,0,…){Yt}=(1,1,1,1,1,1,1,…
Embora , a amostra da série temporal signifique não dará você é a média de .E[Yt]=12St=1t∑ti=1YiYt