Uma das questões importantes que os meteorologistas enfrentam é se a série fornecida pode ser prevista ou não?
Eu me deparei com um artigo intitulado " Entropia como um indicador prioritário de previsibilidade ", de Peter Catt, que usa Entropia aproximada (ApEn) como uma medida relativa para determinar uma determinada série temporal que é previsível.
O artigo diz,
"Valores menores de ApEn indicam uma chance maior de que um conjunto de dados seja seguido por dados semelhantes (regularidade). Por outro lado, um valor maior de ApEn indica uma chance menor de repetição de dados semelhantes (irregularidade). Portanto, valores maiores transmitem mais desordem , aleatoriedade e complexidade do sistema ".
E é seguido por fórmulas matemáticas para calcular ApEn. Essa é uma abordagem interessante, pois fornece um valor numérico que pode ser usado para avaliar a capacidade de previsão em sentido relativo. Não sei o que significa Entropia Aproximada, estou lendo mais sobre isso.
Há um pacote chamado pracma em R
que permite calcular ApEn. Para fins ilustrativos, usei 3 séries temporais diferentes e calculei os números ApEn.
- Série 1: A famosa série temporal do AirPassenger - é altamente determinística e devemos poder fazer previsões facilmente.
- Série 2: Série temporal das manchas solares - é muito bem definida, mas deve ser menos previsível que a série 1.
- Série 3: Número aleatório Não há como prever esta série.
Portanto, se calcularmos o ApEn, a Série 1 deve ser menor que a Série 2 e deve ser muito, muito menor que a Série 3.
Abaixo está o trecho R que calcula o ApEn para todas as três séries.
library("pracma")
> series1 <- approx_entropy(AirPassengers)
> series1
[1] 0.5157758
> series2 <- approx_entropy(sunspot.year)
> series2
[1] 0.762243
> series3 <- approx_entropy(rnorm(1:30))
> series3
[1] 0.1529609
Não é o que eu esperava. A série aleatória tem um número menor que a série AirPassenger bem definida. Mesmo se eu aumentar o número aleatório para 100, ainda assim recebo o que é menor do que a bem definida série 2 / Sunspot.yealry.
> series3 <- approx_entropy(rnorm(1:100))
> series3
[1] 0.747275
Abaixo estão minhas perguntas:
- Existem 2 parâmetros no cálculo de ApEn (
m
er
)? Como determiná-los. Utilizei padrões noR
código acima. - O que estou fazendo incorretamente está mostrando que incorretamente o ApEn é mais baixo para números aleatórios vs. uma série bem definida, como sunspot.yearly.
- Devo dessazonalizar / prejudicar a série e depois estimar o ApEn. O autor, no entanto, aplicou o ApEn diretamente à série.
- Existe outra maneira de determinar se a série é previsível?