O que é diferença-em-diferenças?

43

A diferença nas diferenças há muito é popular como uma ferramenta não experimental, especialmente em economia. Alguém pode fornecer uma resposta clara e não técnica para as seguintes perguntas sobre diferença de diferença.

O que é um estimador de diferença de diferença?
Por que um estimador de diferença de diferença é útil?
Podemos realmente confiar em estimativas de diferença na diferença?

regression econometrics difference-in-difference

— Graham Cookson
fonte

Alguém sabe como estimar uma diferença na regressão da diferença no Gretl? Preciso trabalhar com dados do OLS ou do painel?

3

@Pyca Parece um uso inadequado de comentários lá. Você deve postar uma nova pergunta, com referência a esta.

— chl

66

O que é uma diferença no estimador de diferenças A
diferença nas diferenças (DiD) é uma ferramenta para estimar os efeitos do tratamento comparando as diferenças pré e pós-tratamento no resultado de um grupo de tratamento e controle. Em geral, estamos interessados em estimar o efeito de um tratamento (por exemplo, status sindical, medicação etc.) sobre um resultado (por exemplo, salários, saúde etc.) como em onde são efeitos fixos individuais (características de indivíduos que não mudam ao longo do tempo), são efeitos fixos no tempo, são covariáveis variáveis no tempo, como a idade dos indivíduos e $D_i$ $Y_i$

Y_{i t} = α_{i} + λ_{t} + ρ D_{i t} + X_{i t}^{'} β + ϵ_{i t}

$Y_{it} = \alpha_i + \lambda_t + \rho D_{it} + X'_{it}\beta + \epsilon_{it}$

α_{i}

$\alpha_i$

λ_{t}

$\lambda_t$

X_{i t}

$X_{it}$

ϵ_{i t}

$\epsilon_{it}$ é um termo de erro. Indivíduos e tempo são indexados por e , respectivamente. Se houver uma correlação entre os efeitos fixos e , a estimativa dessa regressão via OLS será enviesada, uma vez que os efeitos fixos não são controlados. Esse é o viés típico da variável omitida .

i

$i$

t

$t$

D_{i t}

$D_{it}$

Para ver o efeito de um tratamento, gostaríamos de saber a diferença entre uma pessoa em um mundo em que ela recebeu o tratamento e uma em que ela não recebe. Obviamente, apenas uma delas é observável na prática. Portanto, procuramos pessoas com as mesmas tendências de pré-tratamento no resultado. Suponhamos que temos dois períodos e dois grupos . Então, supondo que as tendências nos grupos de tratamento e controle continuariam da mesma maneira que antes na ausência de tratamento, podemos estimar o efeito do tratamento como $t = 1, 2$ $s = A,B$

ρ = (E [Y_{i s t} | s = A, t = 2] - E [Y_{i s t} | s = A, t = 1]) - (E [Y_{i s t} | s = B, t = 2] - E [Y_{i s t} | s = B, t = 1])

$\rho = (E[Y_{ist}|s=A,t=2] - E[Y_{ist}|s=A,t=1]) - (E[Y_{ist}|s=B,t=2] - E[Y_{ist}|s=B,t=1])$

Graficamente, isso seria algo parecido com isto: insira a descrição da imagem aqui

Você pode simplesmente calcular esses meios manualmente, ou seja, obter o resultado médio do grupo nos dois períodos e fazer a diferença. Em seguida, obtenha o resultado médio do grupo nos dois períodos e faça a diferença. Então faça a diferença nas diferenças e esse é o efeito do tratamento. No entanto, é mais conveniente fazer isso em uma estrutura de regressão, pois isso permite que você $A$ $B$

controlar covariáveis
obter erros padrão para o efeito do tratamento para ver se é significativo

Para fazer isso, você pode seguir uma das duas estratégias equivalentes. Gere um manequim do grupo de controle que seja igual a 1 se uma pessoa estiver no grupo e 0, caso contrário, gere um manequim de tempo que seja igual a 1 se e 0, e depois regride $\text{treat}_i$ $A$ $\text{time}_t$ $t=2$

Y_{i t} = β_{1} + β_{2} ({treat}_{i}) + β_{3} ({time}_{t}) + ρ ({treat}_{i} \cdot {time}_{t}) + ϵ_{i t}

$Y_{it} = \beta_1 + \beta_2 (\text{treat}_i) + \beta_3 (\text{time}_t) + \rho (\text{treat}_i \cdot \text{time}_t) + \epsilon_{it}$

Ou você simplesmente gera um fictício que é igual a um se uma pessoa estiver no grupo de tratamento E o período de tempo é o período de pós-tratamento e é zero caso contrário. Então você regredirá $T_{it}$

Y_{i t} = β_{1} γ_{s} + β_{2} λ_{t} + ρ T_{i t} + ϵ_{i t}

$Y_{it} = \beta_1 \gamma_s + \beta_2 \lambda_t + \rho T_{it} + \epsilon_{it}$

onde é novamente um manequim para o grupo de controle e são manequins de tempo. As duas regressões fornecem os mesmos resultados para dois períodos e dois grupos. A segunda equação é mais geral, embora se estenda facilmente a vários grupos e períodos. Em ambos os casos, é assim que você pode estimar a diferença nas diferenças de um modo que inclua variáveis de controle (eu as deixei de fora das equações acima para não confundi-las, mas você pode simplesmente incluí-las) e obter erros padrão por inferência. $\gamma_s$ $\lambda_t$

Por que a diferença no estimador de diferenças é útil?
Como afirmado anteriormente, o DiD é um método para estimar os efeitos do tratamento com dados não experimentais. Essa é a característica mais útil. DiD também é uma versão da estimativa de efeitos fixos. Enquanto o modelo de efeitos fixos assume , DiD faz uma suposição semelhante, mas no nível do grupo, . Portanto, o valor esperado do resultado aqui é a soma de um grupo e um efeito no tempo. Então qual a diferença? Para Você não precisa necessariamente de dados em painel, enquanto suas seções transversais repetidos são extraídos da mesma unidade agregada . Isso torna o DiD aplicável a uma matriz mais ampla de dados do que os modelos de efeitos fixos padrão que requerem dados do painel. $E(Y_{0it}|i,t) = \alpha_i + \lambda_t$ $E(Y_{0it}|s,t) = \gamma_s + \lambda_t$ $s$

Podemos confiar na diferença nas diferenças?
A suposição mais importante em DiD é a suposição de tendências paralelas (veja a figura acima). Nunca confie em um estudo que não mostre graficamente essas tendências! Os artigos da década de 1990 podem ter escapado disso, mas hoje em dia nosso entendimento sobre DiD é muito melhor. Se não houver um gráfico convincente que mostre as tendências paralelas nos resultados do pré-tratamento para os grupos de tratamento e controle, seja cauteloso. Se a suposição de tendências paralelas se mantiver e pudermos descartar com credibilidade quaisquer outras alterações variantes no tempo que possam confundir o tratamento, o DiD é um método confiável.

Outra palavra de cautela deve ser aplicada quando se trata do tratamento de erros padrão. Com muitos anos de dados, você precisa ajustar os erros padrão para autocorrelação. No passado, isso foi negligenciado, mas desde Bertrand et al. (2004) "Quanto devemos confiar nas estimativas das diferenças nas diferenças?" sabemos que isso é um problema. No artigo, eles fornecem vários remédios para lidar com a autocorrelação. O mais fácil é agrupar no identificador de painel individual, o que permite a correlação arbitrária dos resíduos entre as séries temporais individuais. Isso corrige a autocorrelação e a heterocedasticidade.

Para referências adicionais, consulte estas notas de aula de Waldinger e Pischke .

— Andy
fonte

6

A Wikipedia tem uma entrada decente sobre esse assunto , mas por que não usar apenas a regressão linear permitindo interações entre suas variáveis independentes de interesse? Isso parece mais interpretável para mim. Em seguida, você pode ler sobre a análise de pistas simples (no livro de Cohen et al. Grátis no Google Livros) se suas variáveis de interesse forem quantitativas.

— Stephen Turner
fonte

0

É uma técnica amplamente usada em econometria para examinar a influência de qualquer evento exógeno em uma série temporal. Você escolhe dois grupos separados de dados relacionados ao antes e depois do evento estudado. Uma boa referência para aprender mais é o livro Introdução à Econometria, de Wooldridge.

— Carlos Dutra
fonte

2

Como uma resposta concisa e não técnica, isso é complementar à resposta de Andy, mas não acho que ela cubra "Podemos realmente confiar em estimativas de diferença em diferença?"

— Silverfish

0

Cuidado:

Dois pontos adicionais são dignos de nota. Primeiro, 80 dos 92 documentos originais do DD têm um problema potencial com termos de erro agrupados, pois a unidade de observação é mais detalhada que o nível de variação (um ponto discutido por Donald e Lang [2001]). Apenas 36 desses documentos abordam esse problema, agrupando erros padrão ou agregando os dados. Segundo, várias técnicas são usadas (mais ou menos informalmente) para lidar com a possível endogeneidade da variável de intervenção. Por exemplo, três artigos incluem uma variável dependente defasada na equação (1), sete incluem uma tendência temporal específica para os estados tratados, quinze plotam alguns gráficos para examinar a dinâmica do efeito do tratamento, três examinam se há um "efeito" antes a lei, dois testam se o efeito é persistente, e onze tentam formalmente fazer diferenças triplas (DDD) encontrando outro grupo controle. Em Bertrand, Duflo e Mullainathan [2002], mostramos que a maioria dessas técnicas não alivia os problemas de correlação serial.

(Bertrand, Duflo e Mullainathan 2004, 253)

— Novo aqui
fonte