Eu tenho um conjunto de dados longitudinal de indivíduos e alguns deles foram submetidos a um tratamento e outros não. Todos os indivíduos estão na amostra desde o nascimento até os 18 anos e o tratamento ocorre em alguma idade entre esse intervalo. A idade do tratamento pode variar entre os casos. Usando a correspondência de propensão, eu gostaria de combinar as unidades tratadas e de controle em pares com a correspondência exata no ano de nascimento, para que eu possa acompanhar cada par desde o nascimento até os 18 anos. No total, existem cerca de 150 indivíduos tratados e 4000 não tratados. Após a correspondência, a idéia é usar uma estratégia de diferença de diferenças para estimar o efeito do tratamento.
O problema que enfrento no momento é fazer a correspondência com os dados do painel. Estou usando o psmatch2
comando Stata e comparo as características domésticas e individuais usando a correspondência de propensão. Em geral, com os dados do painel, haverá diferentes combinações ótimas para cada idade. Como exemplo: se A é tratado, B e C são controles e todos nasceram em 1980, então A e B podem corresponder em 1980 aos 0 anos de idade, enquanto A e C são correspondidos em 1981 aos 1 anos de idade e assim por diante. . Também A pode ser combinado com seus próprios valores de pré-tratamento de anos anteriores.
Para contornar esse problema, calculei a média de todas as variáveis que variam no tempo, de modo que a correspondência possa identificar indivíduos que são, em média, os mais semelhantes ao longo da duração da amostra e eu faço a correspondência separadamente para cada faixa etária de 0 a 18 anos. Infelizmente, isso ainda corresponde a uma unidade de controle diferente para cada unidade tratada por faixa etária.
Se alguém pudesse me direcionar para um método de correspondência pareada com os dados do painel no Stata, isso seria muito apreciado.