Afinal, calculamos o VIF por . Um VIF de corresponde a um de . Para mim, as informações fornecidas por se tornam mais obscuras quando aplico a fórmula VIF. Por que não posso simplesmente usar para detectar multicolinearidade?
Afinal, calculamos o VIF por . Um VIF de corresponde a um de . Para mim, as informações fornecidas por se tornam mais obscuras quando aplico a fórmula VIF. Por que não posso simplesmente usar para detectar multicolinearidade?
Respostas:
Você fez um bom ponto. Gostaria de salientar que uma coisa para a qual gostamos de usar o VIF é sua relação com o erro padrão das estimativas do coeficiente beta. Podemos dizer que, o erro padrão é uma função do MSE (a variabilidade total em torno do modelo), (a variabilidade da k-ésima variável) e o VIF para a k-ésima variável . Seria estranho dizer, uma função do inverso de 1 menos o coeficiente de determinação parcial. ie
Quando soube, me disseram que os números maiores tornavam mais fácil a identificação a olho nu. Meu instrutor também usou 10 como ponto de corte e não 5. Portanto, se você tivesse muitos cálculos VIF em uma matriz de algum tipo, arredondaria para o dígito e depois numeraria com 2 dígitos = multicolinearidade.
Também acho que a intuição do VIF é que estamos alterando os valores para crescer exponencialmente e não linearmente: 0,8, 0,85, 0,90, 0,95 vs 5, 6,66, 10, 20 novamente, tornando mais fácil a identificação.
Dito isto, como existe um mapeamento 1-1, você pode usar e nada muda