268

Em termos simples, como você explicaria (talvez com exemplos simples) a diferença entre modelos de efeito fixo, efeito aleatório e efeito misto?

— Andrew
fonte

4

Também acho que às vezes é difícil determinar quando um efeito deve ser considerado fixo ou aleatório. Embora existam algumas recomendações sobre esse fato, nem sempre é fácil tomar a decisão certa.

— Manuel Ramón

3

Penso que este link pode ser útil para esclarecer os princípios subjacentes aos modelos mistos: modelos fixos, aleatórios e mistos (documentação do SAS) .

— pietrop 4/09/13

6

Uma resposta extremamente útil também pode ser encontrada aqui: Qual é a diferença entre efeitos aleatórios, efeitos mistos e modelo marginal?

— gung

145

O estatístico Andrew Gelman diz que os termos 'efeito fixo' e 'efeito aleatório' têm significados variáveis, dependendo de quem os usa. Talvez você possa escolher qual das 5 definições se aplica ao seu caso. Em geral, pode ser melhor procurar equações que descrevam o modelo de probabilidade que os autores estão usando (ao ler) ou escrever o modelo de probabilidade completo que você deseja usar (ao escrever).

Aqui descrevemos cinco definições que vimos:

Efeitos fixos são constantes entre indivíduos e efeitos aleatórios variam. Por exemplo, em um estudo de crescimento, um modelo com interceptação aleatória e inclinação fixa corresponde a linhas paralelas para diferentes indivíduos , ou o modelo . Kreft e De Leeuw (1998) distinguem, portanto, entre coeficientes fixos e aleatórios. $a_i$ $b$ $i$ $y_{it} = a_i + b t$

Os efeitos são fixos se forem interessantes em si ou aleatórios se houver interesse na população subjacente. Searle, Casella e McCulloch (1992, Seção 1.4) exploram essa distinção em profundidade.

“Quando uma amostra esgota a população, a variável correspondente é fixa; quando a amostra é uma parte pequena (ou seja, insignificante) da população, a variável correspondente é aleatória. ”(Green e Tukey, 1960)

“Se um efeito é assumido como um valor realizado de uma variável aleatória, é chamado efeito aleatório.” (LaMotte, 1983)

Os efeitos fixos são estimados usando mínimos quadrados (ou, mais geralmente, máxima verossimilhança) e efeitos aleatórios são estimados com o encolhimento ("previsão imparcial linear" na terminologia de Robinson, 1991). Essa definição é padrão na literatura de modelagem multinível (ver, por exemplo, Snijders e Bosker, 1999, Seção 4.2) e em econometria.

[ Gelman, 2004, Análise de variância - por que é mais importante do que nunca. Os Anais de Estatística. ]

— John Salvatier
fonte

4

+1: link muito bom! Eu acho que a definição também varia de acordo com o campo (por exemplo, # 4 é muito matemática / estatística, porém # 1 e # 2 são mais "compreensível" a partir de um ponto de ciência da vida de vista)

— nico

12

Também é informativo ler a Discussão e a Réplica deste artigo. Na discussão, Peter McCullagh escreveu que discorda de uma parte substancial do que Gelman escreveu. Meu argumento não é favorecer um ou outro, mas observar que há discordância substancial entre os especialistas e não colocar muito peso em um artigo.

— julieth 22/07/12

6

Toda a discussão está no link

— julieth 22/07/12

36

É engraçado que Andrew Gelman seja descrito como um "blogueiro" e não como um dos principais estatísticos do mundo hoje. Embora ele seja, obviamente, um blogueiro, ele provavelmente deveria ser chamado de "Estatístico Andrew Gelman", se qualquer qualificador for usado.

— Equilíbrio Brash

4

Mas como estatístico e não apenas como um blogueiro sofisticado, ele deveria ter colocado pelo menos frequências relativas subjetivas do uso de cinco casos. Quando as pessoas falam sobre efeitos fixos vs efeitos aleatórios que na maioria das vezes dizer:

(4) “If an effect is assumed to be a realized value of a random variable, it is called a random effect.” (LaMotte, 1983)

— Ufos

251

Existem bons livros sobre isso, como Gelman e Hill . O que se segue é essencialmente um resumo de sua perspectiva.

Primeiro de tudo, você não deve ficar muito envolvido com a terminologia. Nas estatísticas, o jargão nunca deve ser usado como um substituto para uma compreensão matemática dos próprios modelos. Isso é especialmente verdadeiro para modelos de efeitos aleatórios e mistos. "Misto" significa apenas que o modelo tem efeitos fixos e aleatórios, então vamos nos concentrar na diferença entre fixo e aleatório.

Efeitos aleatórios versus efeitos fixos

Digamos que você tenha um modelo com um preditor categórico, que divide suas observações em grupos de acordo com os valores da categoria. * Os coeficientes do modelo, ou "efeitos", associados a esse preditor podem ser fixos ou aleatórios. A diferença prática mais importante entre os dois é esta:

Efeitos aleatórios são estimados com pool parcial, enquanto efeitos fixos não são.

O agrupamento parcial significa que, se você tiver poucos pontos de dados em um grupo, a estimativa do efeito do grupo será parcialmente baseada nos dados mais abundantes de outros grupos. Esse pode ser um bom compromisso entre estimar um efeito, agrupando completamente todos os grupos, que mascara a variação no nível do grupo e estimando um efeito para todos os grupos completamente separadamente, o que pode fornecer estimativas ruins para grupos de baixa amostra.

Efeitos aleatórios são simplesmente a extensão da técnica de pool parcial como modelo estatístico de uso geral. Isso permite a aplicação da ideia por princípios a uma ampla variedade de situações, incluindo múltiplos preditores, variáveis contínuas e categóricas mistas e estruturas de correlação complexas. (Mas com grande poder vem uma grande responsabilidade: a complexidade da modelagem e da inferência é substancialmente aumentada e pode dar origem a preconceitos sutis que exigem considerável sofisticação para serem evitados.)

Para motivar o modelo de efeitos aleatórios, pergunte-se: por que você faria um pool parcial? Provavelmente porque você acha que os pequenos subgrupos fazem parte de algum grupo maior com um efeito médio comum. As médias do subgrupo podem se desviar um pouco da média do grande grupo, mas não por um valor arbitrário. Para formalizar essa idéia, postulamos que os desvios seguem uma distribuição, tipicamente gaussiana. É aí que entra o "aleatório" nos efeitos aleatórios: estamos assumindo que os desvios dos subgrupos de um pai seguem a distribuição de uma variável aleatória. Depois de ter essa ideia em mente, as equações do modelo de efeitos mistos seguem naturalmente.

$\ell_2$

Infelizmente, a confusão de conceito causada por esses termos levou a uma profusão de definições conflitantes . Das cinco definições neste link, apenas o número 4 está completamente correto no caso geral, mas também é completamente pouco informativo. Você precisa ler artigos e livros inteiros (ou, na sua falta, neste post) para entender o que essa definição implica no trabalho prático.

Exemplo

Vejamos um caso em que a modelagem de efeitos aleatórios pode ser útil. Suponha que você queira estimar a renda familiar média dos EUA por CEP. Você tem um grande conjunto de dados que contém observações sobre os rendimentos e códigos postais das famílias. Alguns códigos postais estão bem representados no conjunto de dados, mas outros têm apenas algumas famílias.

Para o seu modelo inicial, você provavelmente obteria a renda média em cada ZIP. Isso funcionará bem quando você tiver muitos dados para um ZIP, mas as estimativas para seus ZIPs com baixa amostra sofrerão uma alta variação. Você pode atenuar isso usando um estimador de retração (também conhecido como pool parcial), que empurrará valores extremos para a renda média em todos os códigos postais.

Mas quanto encolhimento / pool você deve fazer por um ZIP específico? Intuitivamente, deve depender do seguinte:

Quantas observações você tem nesse ZIP
Quantas observações você tem em geral
A nível individual média e variância da renda familiar em todos os códigos postais
A variação no nível do grupo na renda familiar média em todos os CEPs

Se você modelar o CEP como um efeito aleatório, a estimativa de renda média em todos os CEPs estará sujeita a um encolhimento estatisticamente bem fundamentado, levando em consideração todos os fatores acima.

A melhor parte é que os modelos de efeitos aleatórios e mistos manipulam automaticamente (4), a estimativa de variabilidade, para todos os efeitos aleatórios no modelo. Isso é mais difícil do que parece à primeira vista: você pode tentar a variação da média da amostra para cada ZIP, mas isso será altamente tendencioso, porque parte da variação entre as estimativas para ZIPs diferentes é apenas uma variação da amostra. Em um modelo de efeitos aleatórios, o processo de inferência considera a variação de amostra e reduz a estimativa de variação de acordo.

Tendo contabilizado (1) - (4), um modelo de efeitos aleatórios / mistos é capaz de determinar o encolhimento apropriado para grupos de amostras baixas. Ele também pode lidar com modelos muito mais complicados com muitos preditores diferentes.

Relação com a Modelagem Bayesiana Hierárquica

Se isso lhe parece uma modelagem bayesiana hierárquica, você está certo - é um parente próximo, mas não idêntico. Os modelos de efeitos mistos são hierárquicos, pois posicionam distribuições para parâmetros latentes e não observados, mas geralmente não são totalmente bayesianos porque os hiperparâmetros de nível superior não receberão os devidos antecedentes. Por exemplo, no exemplo acima, provavelmente trataríamos a renda média em um determinado ZIP como uma amostra de uma distribuição normal, com média e sigma desconhecidos a serem estimados pelo processo de ajuste de efeitos mistos. No entanto, um modelo de efeitos mistos (não Bayesiano) normalmente não terá um anterior na média e sigma desconhecidos, portanto, não é totalmente Bayesiano. Dito isto, com um conjunto de dados de tamanho decente, o modelo padrão de efeitos mistos e a variante totalmente bayesiana geralmente fornecerão resultados muito semelhantes.

* Enquanto muitos tratamentos deste tópico se concentram em uma definição restrita de "grupo", o conceito é de fato muito flexível: é apenas um conjunto de observações que compartilham uma propriedade comum. Um grupo pode ser composto de várias observações de uma única pessoa, ou várias pessoas em uma escola, ou várias escolas em um distrito, ou várias variedades de um único tipo de fruta, ou vários tipos de vegetais da mesma colheita, ou várias colheitas. do mesmo tipo de vegetal etc. Qualquer variável categórica pode ser usada como variável de agrupamento.

— Paulo
fonte

19

+6. Penso que esta é atualmente a melhor resposta neste tópico e, esperançosamente, com o tempo ela se tornará a mais votada. Uma sugestão que eu faria é incluir algumas fórmulas: talvez na sua seção Exemplo você possa fornecer fórmulas especificando os modelos de efeitos fixos e de efeitos aleatórios (e talvez também o modelo de "coeficiente único", ou seja, o modelo com "pool completo" "). Acho que as fórmulas tornarão sua resposta mais clara e mais atraente / atraente (atualmente parece um pouco com uma parede de texto).

— Ameba

3

@amoeba thanks! Você está certo sobre o coeficiente ser a palavra errada, é mais como "termo modelo" do que coeficiente. As fórmulas ajudariam a esclarecer essa e outras questões. Eu tenho lentamente ajustado essa resposta com o tempo e a inspiração, e continuarei a fazê-lo até que chegue aonde precisa! Provavelmente elaborarei as fórmulas para "regressão contra uma única variável categórica". Conjunto completo = coeficientes de grupo são idênticos (delta anterior, zero sigma), conjunto parcial = eles podem diferir um pouco (sigma finito), sem conjunto = sem restrição (sigma infinito).

— Paul

Obrigado pela ótima resposta! No entanto, perdi você em "Você pode atenuar isso usando um estimador de retração (também conhecido como pool parcial)), que empurrará valores extremos para a renda média em todos os códigos postais". O que é pool parcial? Você poderia dar um exemplo intuitivo? Além disso, como a página da Wikipedia sobre efeitos aleatórios concorda com o que você disse? O exemplo de um "efeito aleatório" não considera o tamanho da amostra.

— AlphaOmega 26/09/16

2

Parabéns pela passagem 100 upvotes para esta resposta :-)

— ameba

1

@Paul Estou realmente lutando para entender como mesclar essa resposta (por exemplo, "As pessoas ... pensam ... efeitos fixos precisam ser usados quando algo é" corrigido ", enquanto efeitos aleatórios precisam ser usados quando algo é" amostrado aleatoriamente ") com o que vejo da maneira que os erros padrão resultam em modelos mistos, onde os SEs com efeitos aleatórios me parecem consistentes apenas com a suposição de que são amostrados aleatoriamente, e os SEs com efeitos fixos somente se forem corrigidos Veja, por exemplo, aqui . O que estou perdendo? Quaisquer pensamentos apreciados além das palavras !!

— justme

47

Escrevi sobre isso em um capítulo de livro sobre modelos mistos (capítulo 13 em Fox, Negrete-Yankelevich e Sosa 2014 ); as páginas relevantes (páginas 311-315) estão disponíveis no Google Livros . Eu acho que a pergunta se reduz a "quais são as definições de efeitos fixos e aleatórios?" (um "modelo misto" é apenas um modelo que contém os dois). Minha discussão diz um pouco menos sobre sua definição formal (para a qual eu recomendaria o artigo de Gelman vinculado pela resposta de @ JohnSalvatier acima) e mais sobre suas propriedades práticas e utilidade. Aqui estão alguns trechos:

A visão tradicional de efeitos aleatórios é uma maneira de fazer testes estatísticos corretos quando algumas observações são correlacionadas.

Também podemos pensar em efeitos aleatórios como uma maneira de combinar informações de diferentes níveis em uma variável de agrupamento.

Efeitos aleatórios são especialmente úteis quando temos (1) muitos níveis (por exemplo, muitas espécies ou blocos), (2) relativamente poucos dados em cada nível (embora precisemos de várias amostras da maioria dos níveis) e (3) desiguais amostragem entre níveis (caixa 13.1).

Frequentistas e bayesianos definem efeitos aleatórios de maneira um pouco diferente, o que afeta a maneira como os utilizam. Os freqüentistas definem efeitos aleatórios como variáveis categóricas cujos níveis são escolhidos aleatoriamente em uma população maior, por exemplo, espécies escolhidas aleatoriamente a partir de uma lista de espécies endêmicas. Bayesianos definem efeitos aleatórios como conjuntos de variáveis cujos parâmetros são [todos] desenhados a partir da mesma distribuição. A definição frequentista é filosoficamente coerente, e você encontrará pesquisadores (incluindo revisores e supervisores) que insistem nisso, mas pode ser praticamente problemático. Por exemplo, isso implica que você não pode usar espécies como efeito aleatório quando tiver observado todas as espécies em seu local de campo - já que a lista de espécies não é uma amostra de uma população maior - ou usar o ano como efeito aleatório, como os pesquisadores raramente realizam um experimento em anos amostrados aleatoriamente - geralmente usam uma série de anos consecutivos ou o conjunto aleatório de anos em que poderiam entrar em campo.

Efeitos aleatórios também podem ser descritos como variáveis preditoras nas quais você está interessado em fazer inferências sobre a distribuição de valores (ou seja, a variação entre os valores da resposta em diferentes níveis), em vez de testar as diferenças de valores entre os níveis particulares.

Às vezes, as pessoas dizem que efeitos aleatórios são "fatores nos quais você não está interessado". Isso nem sempre é verdade. Embora geralmente seja o caso em experimentos ecológicos (onde a variação entre locais é geralmente apenas um incômodo), às vezes é de grande interesse, por exemplo, em estudos evolutivos em que a variação entre genótipos é a matéria-prima para a seleção natural ou em estudos demográficos onde a variação entre os anos reduz as taxas de crescimento a longo prazo. Em alguns casos, efeitos fixos também são usados para controlar variações desinteressantes, por exemplo, usar a massa como covariável para controlar os efeitos do tamanho do corpo.

Você também ouvirá que "você não pode dizer nada sobre o valor (previsto) de um modo condicional". Isso também não é verdade - você também não pode testar formalmente uma hipótese nula de que o valor é igual a zero ou que o valor os valores de dois níveis diferentes são iguais, mas ainda é perfeitamente sensato olhar para o valor previsto e até calcular um erro padrão do valor previsto (por exemplo, consulte as barras de erro nos modos condicionais na figura 13.1).

$\textrm{species_mean} \sim {\cal N}(\textrm{genus_mean}, \sigma^2_{\textrm{species}})$

Eu disse acima que efeitos aleatórios são mais úteis quando a variável de agrupamento possui muitos níveis medidos. Por outro lado, os efeitos aleatórios geralmente são ineficazes quando a variável de agrupamento possui poucos níveis. Você geralmente não pode usar efeitos aleatórios quando a variável de agrupamento possui menos de cinco níveis, e as estimativas de variação de efeitos aleatórios são instáveis com menos de oito níveis, porque você está tentando estimar uma variação de uma amostra muito pequena.

— Ben Bolker
fonte

a pré-visualização atualmente não mostra páginas após 311, e perde a p 310, o que parece ser muito útil aqui ...

— voa

talvez seja uma questão regional? obrigado pela resposta clara acima, de qualquer maneira!

— voa

1

Também não tenho acesso ao resultado do Google Livros. Obrigado por incluir o texto aqui.

— precisa

Eu realmente gosto deste trecho. Esta é talvez a descrição mais clara e mais útil sobre quando e por que usar efeitos aleatórios que eu já vi. Gostaria de tê-lo quando eu estava ensinando alguns anos atrás.

— Gregor

39

Efeito fixo: algo que o pesquisador manipula diretamente e geralmente é repetível, por exemplo, administração de medicamentos - um grupo recebe medicamento, um grupo recebe placebo.

Efeito aleatório: fonte de variação aleatória / unidades experimentais, por exemplo, indivíduos retirados (aleatoriamente) de uma população para um ensaio clínico. Efeitos aleatórios estimam a variabilidade

Efeito misto: inclui ambos, o efeito fixo nesses casos está estimando os coeficientes no nível da população, enquanto os efeitos aleatórios podem explicar diferenças individuais em resposta a um efeito, por exemplo, cada pessoa recebe o medicamento e o placebo em diferentes ocasiões, o efeito fixo. effect estima o efeito da droga, os termos de efeitos aleatórios permitiriam que cada pessoa respondesse à droga de maneira diferente.

Categorias gerais de efeitos mistos - medidas repetidas, longitudinal, hierárquica, plotagem dividida.

— Matt Albrecht
fonte

3

Você não está errado, mas sua definição do que é um efeito fixo não é o que eu pensaria quando alguém dissesse efeito fixo. Aqui está o que penso quando alguém diz efeito fixo en.wikipedia.org/wiki/Difference_in_differences , ou este stata.com/support/faqs/stat/xtreg2.html (particularmente a equação 3 na página Stata)

— Andy W

@ AndyW: Entendo corretamente que sua compreensão do que "efeito fixo" corresponde à definição # 1, listada por Gelman e citada na resposta (aceita) de JohnSalvatier neste tópico?

— Ameba 5/05

1

a_{i}

$a_i$

1

a_{i}

$a_i$

1

@amoeba Concordo que esta resposta deve ser -1. Ele não fornece uma explicação geral precisa, nem especifica as condições em que essa explicação específica seria válida. Então, quem poderia encontrar essa resposta e obter conhecimento útil e confiável?

— Paul

23

Eu vim para esta pergunta a partir daqui , uma possível duplicata.

Já existem várias respostas excelentes, mas, como indicado na resposta aceita, existem muitos usos diferentes (mas relacionados) do termo, portanto, pode ser valioso dar a perspectiva empregada na econometria, que ainda não parece ser totalmente abordada aqui. .

y_{i t} = X_{i t} δ + α_{i} + η_{i t},

$y_{it}=X_{it}\delta+\alpha_i+\eta_{it},$

α_{i}

$\alpha_i$

η_{i t}

$\eta_{it}$

$\alpha_i$

$\alpha_i$ $X_{it}$ $Cov(\alpha_i,X_{it})=0$

$y$ $X$ $y_{it}$ $X_{it}$

$\alpha_i$ $X_{it}$ $i$ $X_{it}=0$ $X_{it}$

$\delta$ $t$ $\alpha_i$ $X_{it}$

$T$ m

Aqui está o código que gera os dados e que produz uma estimativa de ER positiva e uma estimativa de FE negativa "correta". (Dito isto, as estimativas de ER também frequentemente serão negativas para outras sementes, veja acima.)

library(Jmisc)
library(plm)
library(RColorBrewer)
# FE illustration
set.seed(324)
m = 8
n = 12

step = 5
alpha = runif(n,seq(0,step*n,by=step),seq(step,step*n+step,by=step))
beta = -1
y = X = matrix(NA,nrow=m,ncol=n)
for (i in 1:n) {
  X[,i] = runif(m,i,i+1)
  X[,i] = rnorm(m,i)
  y[,i] = alpha[i] + X[,i]*beta + rnorm(m,sd=.75)  
}
stackX = as.vector(X)
stackY = as.vector(y)

darkcols <- brewer.pal(12, "Paired")
plot(stackX,stackY,col=rep(darkcols,each=m),pch=19)

unit = rep(1:n,each=m)
# first two columns are for plm to understand the panel structure
paneldata = data.frame(unit,rep(1:m,n),stackY,stackX) 
fe <- plm(stackY~stackX, data = paneldata, model = "within")
re <- plm(stackY~stackX, data = paneldata, model = "random")

A saída:

> fe

Model Formula: stackY ~ stackX

Coefficients:
 stackX 
-1.0451 


> re

Model Formula: stackY ~ stackX

Coefficients:
(Intercept)      stackX 
   18.34586     0.77031

— Christoph Hanck
fonte

1

δ

$\delta$

1

Além disso, é possível lidar com este exemplo com efeitos mistos. Aqui está o artigo que mostra como: academiccommons.columbia.edu/download/fedora_content/download/…

— Paul

1

T \to \infty

$T\to\infty$

N

$N$

7

Na discussão anterior, seria mais preciso substituir "efeitos aleatórios" por "a versão restrita de efeitos aleatórios implementados no pacote plm de R". Existem outros modelos de efeitos aleatórios que lidariam bem com a questão do preditor / grupo correlacionado, como no artigo citado em meu comentário anterior. Eles ainda não fazem parte dos pacotes / literatura de econometria. Parece que as definições econométricas de efeitos fixos e aleatórios são muito específicas do domínio e não são realmente representativas de seus significados gerais mais fundamentais na literatura estatística.

— Paulo

4

Justo, fiz uma pequena edição. Mas, imo, é exatamente isso que torna esse segmento tão valioso: campos diferentes significam coisas diferentes pela mesma terminologia, e as várias postagens ajudam a explicar essas diferenças.

— Christoph Hanck 5/05

12

A distinção é significativa apenas no contexto de estatísticas não bayesianas. Nas estatísticas bayesianas, todos os parâmetros do modelo são "aleatórios".

— Shige
fonte

1

Interessante. Mas, como fixo ou aleatório pode ser considerado uma condição de uma determinada variável (uma determinada coluna de dados) em vez de um parâmetro associado a essa variável, ... sua resposta se aplica totalmente?

— Rolando2

1

@ rolando2 De qualquer forma, isso é simplesmente falso. Especificamente, para os bayesianos, os parâmetros são o tipo de coisa que a teoria / probabilidade diz que são. Somente a incerteza de alguém sobre quais valores eles assumem é representada usando distribuições de probabilidade. Conseqüentemente, às vezes, os parâmetros são modelados como fixos e desconhecidos ('fixos') e, às vezes, como provenientes de uma distribuição ('aleatória'), embora o último dispositivo seja frequentemente motivado por um julgamento de permutabilidade, e não por uma crença sobre um processo de amostragem.

— conjugateprior

Isso contrasta com a resposta do @ben. Eu acredito que a resposta está errada.

— SmallChess

9

Em econometria, os termos são normalmente aplicados em modelos lineares generalizados, em que o modelo tem a forma

y_{i t} = g (x_{i t} β + α_{i} + u_{i t}) .

$y_{it} = g(x_{it} \beta + \alpha_i + u_{it}).$

$\alpha_i \perp u_{it}$

$\alpha_i \not \perp u_{it}$

Em modelos lineares , a presença de um efeito aleatório não resulta em inconsistência do estimador OLS. No entanto, o uso de um estimador de efeitos aleatórios (como mínimos quadrados generalizados viáveis) resultará em um estimador mais eficiente .

Em modelos não lineares , como probit, tobit, ..., a presença de um efeito aleatório resultará, em geral, em um estimador inconsistente. O uso de um estimador de efeitos aleatórios restaurará a consistência.

Para modelos lineares e não lineares, efeitos fixos resultam em um viés. No entanto, em modelos lineares, existem transformações que podem ser usadas (como primeiras diferenças ou degradação), em que o OLS nos dados transformados resultará em estimativas consistentes. Para modelos não lineares, existem algumas exceções em que existem transformações, com efeitos fixos no logit sendo um exemplo.

Exemplo: Probit de efeitos aleatórios. Suponha

y_{i t}^{*} = x_{i t} β + α_{i} + u_{i t}, α_{i} \sim N (0, σ_{α}^{2}), u_{i t} \sim N (0, 1) .

$y^*_{it} = x_{it} \beta + \alpha_i + u_{it}, \quad \alpha_i \sim \mathcal{N}(0,\sigma_\alpha^2), u_{it} \sim \mathcal{N}(0,1).$

e o resultado observado é

y_{i t} = 1 (y_{i t}^{*} > 0) .

$y_{it} = \mathbb{1}(y^*_{it} > 0).$

O estimador de probabilidade máxima combinada minimiza a média amostral de

\hat{β} = \arg min_{β} N^{- 1} \sum_{i = 1}^{N} \log \prod_{t = 1}^{T} [G (x_{i t} β)]^{y_{i t}} [1 - G (x_{i t} β)]^{1 - y_{i t}} .

$\hat{\beta} = \arg \min_\beta N^{-1} \sum_{i=1}^N \log \prod_{t=1}^T [G(x_{it}\beta)]^{y_{it}} [1 - G(x_{it}\beta)] ^{1-y_{it}}.$

Obviamente, aqui o log e o produto simplificam, mas por razões pedagógicas, isso torna a equação mais comparável ao estimador de efeitos aleatórios, que tem a forma

\hat{β} = \arg min_{β} N^{- 1} \sum_{i = 1}^{N} \log \int \prod_{t = 1}^{T} [G (x_{i t} β + σ_{α} a)]^{y_{i t}} [1 - G (x_{i t} β + σ_{α} a)]^{1 - y_{i t}} ϕ (a) d a .

$\hat{\beta} = \arg \min_\beta N^{-1} \sum_{i=1}^N \log \int \prod_{t=1}^T [G(x_{it}\beta + \sigma_\alpha a)]^{y_{it}} [1 - G(x_{it}\beta + \sigma_\alpha a )] ^{1-y_{it}} \phi(a) \mathrm{d}a.$

Podemos, por exemplo, aproximar a integral por meio de randomização, retirando de normais normais e avaliando a probabilidade de cada uma. $R$

\hat{β} = \arg min_{β} N^{- 1} \sum_{i = 1}^{N} \log R^{- 1} \sum_{r = 1}^{R} \prod_{t = 1}^{T} [G (x_{i t} β + σ_{α} a_{r})]^{y_{i t}} [1 - G (x_{i t} β + σ_{α} a)]^{1 - y_{i t}}, a_{r} \sim N (0, 1) .

$\hat{\beta} = \arg \min_\beta N^{-1} \sum_{i=1}^N \log R^{-1} \sum_{r=1}^R \prod_{t=1}^T [G(x_{it}\beta + \sigma_\alpha a_r)]^{y_{it}} [1 - G(x_{it}\beta + \sigma_\alpha a )] ^{1-y_{it}},\quad a_r \sim \mathcal{N}(0,1).$

A intuição é a seguinte: não sabemos que tipo , cada observação é. Em vez disso, avaliamos o produto das probabilidades ao longo do tempo para uma sequência de empates. O tipo mais provável de observação terá a maior probabilidade em todos os períodos e, portanto, dominará a contribuição da probabilidade para a sequência das observações. $\alpha_i$ $i$ $T$

— Superpronker
fonte

7

Não é realmente uma definição formal, mas eu gosto dos seguintes slides: Modelos mistos e por que os sociolinguistas devem usá-los ( espelho ), de Daniel Ezra Johnson. Uma breve recapitulação 'é oferecida no slide 4. Embora se concentre principalmente em estudos psicolinguísticos, é muito útil como primeiro passo.

— chl
fonte

Acho que vou precisar ver essa apresentação pessoalmente para obter o impacto total.

— Andy W

Esses slides não são úteis.

— voa

7

Embora esse link possa responder à pergunta, é melhor incluir aqui as partes essenciais da resposta e fornecer o link para referência. As respostas somente para links podem se tornar inválidas se a página vinculada for alterada.

— Ben Bolker

1

o link está morto

— baxx

3

Outra perspectiva muito prática sobre modelos de efeitos aleatórios e fixos vem da econometria ao fazer regressões lineares nos dados do painel . Se você estiver estimando a associação entre uma variável explicativa e uma variável de resultado em um conjunto de dados com várias amostras por indivíduo / grupo, essa é a estrutura que você deseja usar.

Um bom exemplo de dados em painel são medições anuais de um conjunto de indivíduos de:

$gender_i$ (sexo da ésima pessoa) $i$
${\Delta}weight_{it}$ (alteração de peso durante o ano para a pessoa ) $t$ $i$
$exercise_{it}$ (exercício diário médio durante o ano para a pessoa ) $t$ $i$

Se estamos tentando entender a relação entre exercício e mudança de peso, configuraremos a seguinte regressão:

${\Delta}weight_{it} = \beta_0$ $exercise_{it} + \beta_1gender_i + \alpha_i + \epsilon_{it}$

$\beta_0$ é a quantidade de interesse
$\beta_1$ não é interessante, estamos apenas controlando o sexo com ela
$\alpha_i$ é a interceptação por indivíduo
$\epsilon_{it}$ é o termo do erro

Em uma configuração como esta, há o risco de endogeneidade. Isso pode acontecer quando variáveis não medidas (como estado civil) estão associadas a exercícios e mudanças de peso. Conforme explicado na p.16 nesta palestra em Princeton , um modelo de efeitos aleatórios (efeitos mistos AKA) é mais eficiente que um modelo de efeitos fixos. No entanto, atribuirá incorretamente parte do efeito da variável não medida na mudança de peso ao exercício, produzindo um incorreto e potencialmente uma significância estatística mais alta do que a válida. Nesse caso, o modelo de efeitos aleatórios não é um estimador consistente de . $\beta_0$ $\beta_0$

Um modelo de efeitos fixos (em sua forma mais básica) controla todas as variáveis não medidas que são constantes ao longo do tempo, mas variam entre indivíduos, incluindo explicitamente um termo de interceptação separado para cada indivíduo ( ) na equação de regressão. Em nosso exemplo, ele controlará automaticamente os efeitos de confusão do gênero, bem como os fatores de confusão não medidos (estado civil, status socioeconômico, escolaridade, etc.). De fato, o gênero não pode ser incluído na regressão e não pode ser estimado por um modelo de efeitos fixos, pois é colinear com os 's. $\alpha_i$ $\beta_1$ $gender_i$ $\alpha_i$

Portanto, a questão principal é determinar qual modelo é apropriado. A resposta é o teste de Hausman . Para usá-lo, realizamos a regressão de efeitos fixos e aleatórios e, em seguida, aplicamos o Teste de Hausman para verificar se suas estimativas de coeficiente divergem significativamente. Se eles divergem, a endogeneidade está em jogo e um modelo de efeitos fixos é a melhor escolha. Caso contrário, iremos com efeitos aleatórios.

— Tom Q.
fonte

Qual é a diferença entre os modelos de efeito fixo, efeito aleatório e efeito misto?

Efeitos aleatórios versus efeitos fixos

Exemplo

Relação com a Modelagem Bayesiana Hierárquica