Por que essa previsão de séries temporais é "muito ruim"?

Estou tentando aprender a usar redes neurais. Eu estava lendo este tutorial .

Depois de ajustar uma rede neural em uma série temporal usando o valor em para prever o valor em o autor obtém o seguinte gráfico, onde a linha azul é a série temporal, o verde é a previsão nos dados do trem, o vermelho é o previsão sobre dados de teste (ele usou uma divisão de teste) $t$ $t+1$

e o chama "Podemos ver que o modelo fez um trabalho muito ruim ao ajustar os conjuntos de dados de treinamento e teste. Basicamente, ele previu o mesmo valor de entrada que a saída".

Então o autor decide usar , e para prever o valor em . Ao fazê-lo, obtém $t$ $t-1$ $t-2$ $t+1$

e diz "Olhando para o gráfico, podemos ver mais estrutura nas previsões".

Minha pergunta

Por que os primeiros "pobres"? parece quase perfeito para mim, prediz todas as mudanças perfeitamente!

E da mesma forma, por que o segundo é melhor? Onde está a "estrutura"? Para mim, parece muito mais pobre que o primeiro.

Em geral, quando é boa uma previsão de séries temporais e quando é ruim?

— Euler_Salter
fonte

Como comentário geral, a maioria dos métodos de BC são para análises transversais e precisam de ajustes para serem aplicados em séries temporais. A principal razão é autocorrelação nos dados, enquanto no ML muitas vezes os dados são assumidos independente na maioria dos métodos populares

— Aksakal

Ele faz um ótimo trabalho de prever todas as alterações ... logo após isso acontecer!

— Hbbs #

@ Hobbs, eu não estou tentando usar t, t-1, t-2 etc para prever t + 1. Eu queria saber se você sabe quantos termos no passado é melhor usar. Se usarmos demais, estaremos super adaptados?

— Euler_Salter

Teria sido mais esclarecedor traçar os resíduos.

— Reo katoa 5/10

Respostas:

É uma espécie de ilusão de ótica: o olho olha para o gráfico e vê que os gráficos vermelho e azul estão ao lado de cada um. O problema é que eles estão próximos um do outro horizontalmente , mas o que importa é a verticaldistância. O olho vê mais facilmente a distância entre as curvas no espaço bidimensional do gráfico cartesiano, mas o que importa é a distância unidimensional dentro de um valor t particular. Por exemplo, suponha que tivéssemos os pontos A1 = (10.100), A2 = (10.1, 90), A3 = (9.8,85), P1 = (10.1.100.1) e P2 = (9.8, 88). Naturalmente, o olho compara P1 a A1, porque esse é o ponto mais próximo, enquanto P2 será comparado a A2. Como P1 está mais próximo de A1 que P2 está em A3, P1 parecerá uma previsão melhor. Mas quando você compara P1 a A1, você está apenas vendo como A1 pode repetir o que viu anteriormente; em relação a A1, P1 não é uma previsão. A comparação adequada é entre P1 vs. A2 e P2 vs. A3, e nesta comparação P2 é melhor que P1. Teria sido mais claro se, além de plotar y_actual e y_pred contra t, houvesse gráficos de (y_pred-y_actual) contra t.

— Acumulação
fonte

Essa é a melhor resposta, pois a outra nem sequer menciona por que uma previsão "boa aparência" é realmente ruim, enquanto você faz um ótimo trabalho!

— Richard Hardy

Por que os primeiros "pobres"? parece quase perfeito para mim, prediz todas as mudanças perfeitamente!

É uma previsão chamada "deslocada". Se você olhar mais de perto o gráfico 1, verá que o poder de previsão é apenas copiar quase exatamente o último valor visto. Isso significa que o modelo aprendeu nada melhor e trata a série temporal como uma caminhada aleatória. Eu acho que o problema pode estar no fato de você usar os dados brutos que você alimenta na rede neural. Esses dados não são estacionários, causando todos os problemas.

— Alexey Burnakov
fonte

Na previsão, isso é chamado de previsão "ingênua", ou seja, use a última observação como previsão

— Aksakal

Obrigado! @Aksakal, você sabe quantos valores anteriores devem ser usados para previsão?

— Euler_Salter

Concentre-se na estacionariedade. Um par de defasagens estacionárias deve ser bastante bom para esta série cronológica. Melhor que 100 defasagens não estacionárias.

— Alexey Burnakov

em séries temporais há uma maneira de obter um bom palpite sobre a estrutura lag através ACF e PACF, pesquisa deste fórum, havia muitos posts sobre como é feito

— Aksakal

@AlexeyBurnakov, então isso significa que devo transformá-lo em estacionário?

— Euler_Salter 5/10