Quando usar efeitos fixos vs usar SEs de cluster?

17

Suponha que você tenha uma única seção de dados em que os indivíduos estejam localizados dentro de grupos (por exemplo, estudantes nas escolas) e deseje estimar um modelo da forma em Y_i = a + B*X_ique Xseja um vetor de características de nível individual e auma constante.

Nesse caso, suponha que a heterogeneidade não observada entre grupos inclua suas estimativas pontuais Be as SEs, uma vez que está correlacionada com sua variável independente de interesse.

Uma opção é agrupar seus SEs por grupos (escolas). Outra é incluir as EFs do grupo. Outra é usar os dois. O que se deve considerar ao escolher entre essas opções? Não está particularmente claro por que alguém pode agrupar SEs por grupo E usar o grupo FE. No meu caso específico, tenho 35 grupos e 5.000 indivíduos aninhados em cada grupo. Eu acompanhei a discussão neste pdf , mas não está muito claro por que e quando alguém pode usar SEs agrupados e efeitos fixos.

(Por favor, discuta os prós e contras de SEs agrupadas versus EFs em vez de sugerir que eu apenas me encaixe em um modelo multinível.)

— Resposta da questão
fonte

21

Ambas as abordagens, usando efeitos fixos de grupo e / ou erro padrão ajustado por cluster, levam em consideração diferentes problemas relacionados aos dados em cluster (ou em painel) e eu os veria claramente como abordagens distintas. Muitas vezes você deseja usar os dois:

Em primeiro lugar, o erro padrão ajustado por cluster para a correlação ou heterocedasticidade dentro do cluster, que o estimador de efeitos fixos não leva em consideração, a menos que você esteja disposto a fazer outras suposições, consulte os slides da aula de Imbens e Wooldridge para uma boa discussão sobre e painéis longos e vários problemas relacionados a esse problema . Há também um artigo novo sobre esse tópico, de Cameron e Miller: Guia do praticante de inferência robusta em cluster, que pode ser interessante para você. Se você não deseja modelar a matriz de variância-covariância e suspeitar que a correlação dentro do cluster esteja presente, aconselho o uso de erro padrão robusto do cluster porque o viés no seu SE pode ser grave (muito mais problemático do que na heterocedasticidade, consulteAngrist & Pischke, capítulo III.8, para uma discussão sobre este tópico. Mas você precisa de cluster suficiente (Angrist e Pischke dizem 40-50 como um papel básico). O erro padrão ajustado pelo cluster leva em consideração o erro padrão, mas não altera as estimativas de pontos (o erro padrão geralmente aumenta)!

A estimativa de efeitos fixos leva em consideração a heterogeneidade não observada, invariável no tempo (como você mencionou). Isso pode ser bom ou ruim: por outro lado, você precisa de menos suposições para obter estimativas consistentes. Por outro lado, você joga fora muita variação que pode ser útil. Algumas pessoas como Andrew Gelman preferem modelagem hierárquica a efeitos fixos, mas aqui as opiniões diferem. A estimativa de efeitos fixos mudará as estimativas pontuais e de intervalo (também aqui o erro padrão geralmente será maior).

Para resumir: O erro padrão robusto de cluster é uma maneira fácil de explicar possíveis problemas relacionados aos dados em cluster, se você não quiser se preocupar em modelar a correlação inter e intra-cluster (e há clusters suficientes disponíveis). A estimativa de efeitos fixos utilizará apenas determinadas variações; portanto, depende do seu modelo se você deseja fazer estimativas com base em menos variações ou não. Porém, sem outras suposições, a estimativa de efeitos fixos não cuidará dos problemas relacionados à correlação intra-cluster para a matriz de variância. O erro padrão robusto do cluster também não levará em conta problemas relacionados ao uso da estimativa de efeitos fixos.

— Arne Jonas Warnke
fonte

2

Boa resposta. A principal questão restante é por que alguém iria querer AMBOS. Imbens e Wooldridge cobrem isso até certo ponto.

— QuestionAnswer

12

Os efeitos corrigidos são para remover a heterogeneidade não observada entre diferentes grupos em seus dados.

Eu discordo da implicação na resposta aceita de que a decisão de usar um modelo de EF dependerá se você deseja usar "menos variação ou não". Se sua variável dependente for afetada por variáveis não observáveis que variam sistematicamente entre os grupos em seu painel, o coeficiente de qualquer variável correlacionada a essa variação será enviesado. A menos que suas variáveis X tenham sido atribuídas aleatoriamente (e nunca estarão com dados de observação), geralmente é bastante fácil argumentar sobre o viés das variáveis omitidas. Você podeseja capaz de controlar algumas das variáveis omitidas com uma boa lista de variáveis de controle, mas se uma identificação forte for seu objetivo número 1, mesmo uma extensa lista de controles poderá deixar espaço para leitores críticos duvidarem de seus resultados. Nesses casos, geralmente é uma boa ideia usar um modelo de efeitos fixos.

Erros padrão agrupados são para contabilizar situações em que as observações DENTRO de cada grupo não são iid (independentemente e identicamente distribuídas).

Um exemplo clássico é se você tiver muitas observações para um painel de empresas ao longo do tempo. Você pode considerar os efeitos fixos no nível da empresa, mas ainda pode haver alguma variação inexplicável na sua variável dependente que está correlacionada ao longo do tempo. Em geral, ao trabalhar com dados de séries temporais, geralmente é seguro assumir correlação serial temporal nos termos de erro nos seus grupos. Essas situações são os casos de uso mais óbvios para SEs em cluster.

Alguns exemplos ilustrativos:

Se você possui dados experimentais nos quais atribui tratamentos aleatoriamente, mas faz observações repetidas para cada indivíduo / grupo ao longo do tempo, seria justificável omitir efeitos fixos, mas gostaria de agrupar seus SEs.

Como alternativa, se você tiver muitas observações por grupo para dados não experimentais, mas cada observação dentro do grupo puder ser considerada como um sorteio do seu grupo maior (por exemplo, você tem observações de muitas escolas, mas cada grupo é um subconjunto sorteado aleatoriamente) alunos da escola), você gostaria de incluir efeitos fixos, mas não precisaria de SEs agrupadas.

— Alex P. Miller
fonte

2

Essas respostas são boas, mas a resposta mais recente e melhor é fornecida por Abadie et al. (2019) "Quando você deve ajustar erros padrão para clustering?" Com efeitos fixos, o principal motivo para agrupar é que você tem heterogeneidade nos efeitos de tratamento entre os clusters. Existem outras razões, por exemplo, se os agrupamentos (por exemplo, empresas, países) são um subconjunto dos agrupamentos na população (sobre os quais você está deduzindo). Clustering é uma questão de design, é a principal mensagem do artigo. Não faça cegamente.

— Kishore Gawande
fonte