Por que não estamos simplesmente usando vez do VIF?

7

Afinal, calculamos o VIF por . Um VIF de corresponde a um de . Para mim, as informações fornecidas por se tornam mais obscuras quando aplico a fórmula VIF. Por que não posso simplesmente usar para detectar multicolinearidade? $1/(1-R_j^2)$ $5$ $R_J^2$ $0.8$ $R_j^2$ $R_j^2$

variance multicollinearity vif

— user105833
fonte

3

Você certamente pode, há uma correspondência individual entre os valores VIF e .

R^{2}

$R^2$

— JohnK

@JohnK Mas por que nos preocupamos em calcular o Vif Então em primeiro lugar?

— usar o seguinte comando

3

(+1) O VIF tem uma interpretação : está intimamente relacionada ao número de condição das Equações Normais .

— whuber

2

Você fez um bom ponto. Gostaria de salientar que uma coisa para a qual gostamos de usar o VIF é sua relação com o erro padrão das estimativas do coeficiente beta. Podemos dizer que, o erro padrão é uma função do MSE (a variabilidade total em torno do modelo), (a variabilidade da k-ésima variável) e o VIF para a k-ésima variável . Seria estranho dizer, uma função do inverso de 1 menos o coeficiente de determinação parcial. ie $s^2\left\{X_k\right\}$

s^{2} {b_{k}} = \frac{M S E}{(n - 1) s^{2} {X_{k}}} (V I F_{k})

$s^2\left\{b_k\right\} = \frac{MSE}{(n-1)s^2\left\{X_k\right\}}(VIF_k)$

— jchaykow
fonte

0

Quando soube, me disseram que os números maiores tornavam mais fácil a identificação a olho nu. Meu instrutor também usou 10 como ponto de corte e não 5. Portanto, se você tivesse muitos cálculos VIF em uma matriz de algum tipo, arredondaria para o dígito e depois numeraria com 2 dígitos = multicolinearidade.

Também acho que a intuição do VIF é que estamos alterando os valores para crescer exponencialmente e não linearmente: 0,8, 0,85, 0,90, 0,95 vs 5, 6,66, 10, 20 novamente, tornando mais fácil a identificação.

Dito isto, como existe um mapeamento 1-1, você pode usar e nada muda $R^2$

— Marsenau
fonte