Estou analisando conjuntos de dados da CPI para países em desenvolvimento que possuem lacunas.
Para cada país, tenho duas séries temporais com médias anuais para os anos 2000-2013: i) IPC geral / geral e ii) IPC de alimentos. Também estou assumindo que o IPC de alimentos deve ter alguma relação com o IPC geral / geral, já que a categoria de alimentos tem seu próprio peso no IPC geral.
Agora, tenho dois tipos de casos, alguns como: http://imgur.com/a/9z7o8#1, em que existem diferenças entre os valores. Estou assumindo que posso interpolar aqui, se sim, como eu iria adiante com isso? Eu também tenho que lidar com casos mais complicados, como: http://imgur.com/a/9z7o8#0 , alguma sugestão nesse caso? Uma simples extrapolação faria sentido aqui?
Uma opção para o meu primeiro caso que li (no BLS) é obter a média geométrica do ano imediatamente antes e depois do valor ausente. Outras pessoas sugeriram que eu previsse os valores ausentes por meio de um modelo de regressão simples do IPC no deflator do PIB daquele ano (o que eu tenho).
Além disso, em alguns casos, existem lacunas nas médias anuais porque os dados mensais necessários para calcular essas médias estão incompletos. Digamos que eu só tenha dados de 2006 para a Rússia nos meses de janeiro a junho, então o ponto médio anual de dados está ausente na série de dados. Suponho que posso apenas obter uma média simples dos meses disponíveis e imputá-la em 2006?
desde já, obrigado