Você responde parcialmente à sua própria pergunta solicitando alterações "longitudinais". Os dados de seção transversal são chamados porque eles tiram uma foto instantânea no tempo, literalmente uma seção transversal cortada de uma sociedade que evolui no tempo, com seus muitos relacionamentos. Portanto, a melhor inferência que você pode esperar é supor que o que você está estudando é invariante no tempo, ou pelo menos concluiu sua evolução.
Por outro lado, os dados que você procura são dados longitudinais ou em painel para economistas.
Uma boa referência que explica principalmente métodos, mas também destaca dois exemplos importantes de Economia, está aqui . O exemplo 2.1 tem taxas de investimento da empresa.
A seção 3 é um pouco mais teórica, mas traz muitas informações: um modelo de dados em painel pode ser
yi,t=αyi,t−1+xi,tγ+ηi+vi,t.
Agora, esse tipo de modelo pode capturar a dependência de estado, que é (próximo à heterogeneidade não observada) uma explicação comum para o motivo pelo qual as pessoas se comportam de maneira diferente. Portanto, se você observar apenas pessoas viajando em um determinado momento, seu não será identificado, o que significa que você não está ciente de quanto a viagem deles ontem influenciou a decisão de viajar novamente.α
Agora, desligue a dependência do tempo por um momento, mas lembre-se de que essa equação provavelmente pode ter sido o verdadeiro modelo.
Agora, em um modelo de seção transversal, você descartaria o índice inteiramente, porque só possui dados em um período. Portanto, você também não tem possibilidade de contabilizar o fato de que cada indivíduo em seu conjunto de dados pode ter totalmente diferentes, o que suas regressões para cima em geral, pelo menos quando o modelo verdadeiro for dinâmico. Essa é provavelmente a razão da superestimação, devido a um efeito individual não observado (também pode ser comum), que você não mediu, mas que foi refletido em seu estudo de seção transversal.tη′is
Agora, insira os dados do painel novamente. O que podemos fazer é subtrair a média ao longo do tempo de cada variável que, dada a média de constante ao longo do tempo, eliminaria esse termo. Essa transformação (outras são possíveis) permite que você se concentre apenas na dinâmica (e na verdade você perderia qualquer regressor invariante no tempo).ηi
Agora, essa é a principal diferença entre os dados da seção transversal e do painel. O fato de você poder eliminar o efeito invariante no tempo porque possui essa variação de tempo permite remover certos vieses que a estimativa de seção transversal não permite detectar. Portanto, antes de considerar uma mudança de política, como um imposto mais alto sobre viagens, porque você espera que as pessoas viajem e deseja mais receita do governo, é mais útil observar o fenômeno ao longo de alguns anos, para ter certeza de que não está capturando heterogeneidade não observada em sua amostra que você interpreta como uma propensão a viajar.
Para estimar esses modelos, é melhor passar pela referência. Mas cuidado: diferentes suposições sobre o comportamento das pessoas tornarão diferentes procedimentos de estimativa admissíveis ou não.
Eu espero que isso ajude!