Estou trabalhando extensivamente com modelos de séries temporais financeiras, principalmente AR (I) MA e Kalman.
Um problema que continuo enfrentando é a frequência de amostragem. Inicialmente, eu pensava que, se fosse oferecida a possibilidade de amostrar com mais frequência a partir de um processo subjacente, eu deveria amostrar com a maior frequência possível, para que eu tenha um número muito maior de amostras; portanto, os parâmetros do meu modelo terão menos variação.
Na realidade, essa idéia não acabou sendo boa. O que aconteceu é que, se o processo subjacente não estiver exibindo variação suficiente, aumentar a frequência de amostragem significa realmente obter muitos (mesmos) valores repetidos. E a construção de um modelo com base nesses valores resulta em modelos com coeficientes de modelo muito pequenos que não prevêem bem no futuro (é claro que a definição de "poço" é subjetiva e o aumento da frequência requer a previsão de muito mais etapas de amostra no futuro para atingir o mesmo intervalo de tempo em uma configuração de frequência mais baixa). O modelo aprende o que encontra mais - uma linha plana.
Eu queria fazer uma abordagem de amostragem adaptativa, ou seja, amostrar com mais frequência quando houver variação e com menos frequência quando não houver. Isso não é fácil, no entanto. Antes de tudo, não está claro que tipo de viés estou introduzindo ao fazê-lo (e será diferente dependendo de como eu acionar a amostra / pular). Em segundo lugar, modelos de séries temporais como o ARIMA não são adequados para etapas de amostra desiguais.
Existe uma boa maneira de lidar com esse problema? Também me faz pensar como é possível obter uma transição perfeita entre modelos de tempo contínuos e modelos de tempo discretos, se os modelos são tão dramaticamente afetados pela frequência de amostragem (especialmente quando os intervalos de tempo ficam cada vez menores)? Qualquer indicação de recursos externos também será apreciada.
obrigado