Eu tenho tentado entender como representar e modelar dados para fazer uma previsão de séries temporais multidimensionais e multivariadas usando Keras (ou TensorFlow), mas ainda não sou muito claro depois de ler muitas postagens / tutoriais / documentação de blog sobre como apresentar os dados no forma correta (a maioria dos exemplos é um pouco menos
Meu conjunto de dados:
- várias cidades
- para as quais tenho informações sobre temperatura, tráfego de carros, umidade
- por exemplo, nos últimos 2 anos (um registro por dia)
O que eu quero fazer: eu gostaria de prever para cada cidade as temperaturas que posso esperar para o próximo ano usando uma versão possivelmente atrasada de temperatura, tráfego de carros e umidade (é claro que haveria muitos outros recursos, mas isso é apenas uma exemplo para o pensamento).
Sobre o que estou confuso: se eu tiver duas cidades, para as quais gravei três recursos por 365 dias. Como devo moldar minha entrada para que o modelo possa gerar uma previsão de 365 dias para essas duas cidades (ou seja, duas séries temporais de temperaturas por 365 dias)?
Intuitivamente, o formato do tensor seria (?, 365, 3)
de 365 dias e 3 recursos. Mas não tenho certeza do que aderir à primeira dimensão e, mais importante, ficaria surpreso se tivesse que ser pelo número de cidades. Mas, ao mesmo tempo, não tenho idéia de como especificar no modelo que ele precisa entender as dimensões corretamente.
Qualquer ponteiro será útil. Eu estou bem familiarizado com o resto do problema (ou seja, como você constrói uma rede no Keras etc., desde que eu fiz isso para outras redes neurais, mas mais especificamente como melhor codificar a sequência para a entrada desejada.)
Ah , também acho que eu poderia treinar e prever cada cidade de forma independente, mas tenho certeza de que todos concordarão que provavelmente há coisas a serem aprendidas que não são específicas de nenhuma cidade, mas que só podem ser vistas se considerarmos várias delas, Por isso, acho que é importante codificá-lo no modelo.