Y=β0+β1X+εwhere ε∼N(0,σ2ε)
β0+β1Xσ2ε
σ2εXYεβ0, β1, σ2ε)Xσ2ε
Y=β0+β1X+εwhere ε∼N(0,f(X)) where f(X)=exp(γ0+γ1X)and γ1≠0
Xf(X) X
X. No entanto, costumo pensar que é melhor olhar para as parcelas. O @Penquin_Knight fez um bom trabalho ao mostrar como é a variação constante, plotando os resíduos de um modelo em que a homocedasticidade é obtida em relação aos valores ajustados. A heterocedasticidade também pode ser detectada em um gráfico dos dados brutos ou em um gráfico de localização de escala (também chamado de nível de dispersão). R convenientemente desenha o último para você com uma chamada para plot.lm(model, which=2)
; é a raiz quadrada dos valores absolutos dos resíduos em relação aos valores ajustados, com uma curva de baixa sobreposição útil. Você deseja que o ajuste do lowess seja plano, não inclinado.
Considere os gráficos abaixo, que comparam a aparência dos dados homoscedásticos e heterocedásticos nesses três tipos diferentes de figuras. Observe a forma do funil para as duas parcelas heterocedásticas superiores e a linha de menor inclinação inclinada para cima na última.
Para completar, eis o código que eu usei para gerar esses dados:
set.seed(5)
N = 500
b0 = 3
b1 = 0.4
s2 = 5
g1 = 1.5
g2 = 0.015
x = runif(N, min=0, max=100)
y_homo = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(s2 ))
y_hetero = b0 + b1*x + rnorm(N, mean=0, sd=sqrt(exp(g1 + g2*x)))
mod.homo = lm(y_homo~x)
mod.hetero = lm(y_hetero~x)