Alguém sabe como descobrir se os pontos 7, 16 e 29 são pontos influentes ou não? Li em algum lugar que, como a distância de Cook é menor que 1, eles não são. Estou certo?
Alguém sabe como descobrir se os pontos 7, 16 e 29 são pontos influentes ou não? Li em algum lugar que, como a distância de Cook é menor que 1, eles não são. Estou certo?
Respostas:
Alguns textos informam que pontos para os quais a distância de Cook é maior que 1 devem ser considerados influentes. Outros textos fornecem um limite de ou 4 / ( N - k - 1 ) , onde N é o número de observações ek o número de variáveis explicativas. No seu caso, a última fórmula deve gerar um limite em torno de 0,1.
John Fox (1), em seu livreto sobre diagnóstico de regressão, é bastante cauteloso quando se trata de fornecer limites numéricos. Ele aconselha o uso de gráficos e examina com mais detalhes os pontos com "valores de D que são substancialmente maiores que os demais". Segundo Fox, os limiares devem ser usados apenas para aprimorar as exibições gráficas.
No seu caso, as observações 7 e 16 podem ser consideradas influentes. Bem, eu teria pelo menos uma olhada neles. A observação 29 não é substancialmente diferente de algumas outras observações.
(1) Fox, John. (1991). Diagnóstico de regressão: uma introdução . Publicações prudentes.
Há um outro ponto que vale a pena mencionar aqui. Na pesquisa observacional, muitas vezes é difícil fazer uma amostragem uniforme no espaço do preditor, e você pode ter apenas alguns pontos em uma determinada área. Tais pontos podem divergir do resto. Ter alguns casos distintos pode ser desconcertante, mas merece uma reflexão considerável antes de ser rebaixado. Pode haver legitimamente uma interação entre os preditores ou o sistema pode mudar para se comportar de maneira diferente quando os valores dos preditores se tornarem extremos. Além disso, eles podem ajudar a desvendar os efeitos dos preditores colineares. Pontos influentes podem ser uma bênção disfarçada.