Qual é a diferença entre o teste de normalidade Shapiro-Wilk e o teste de normalidade Kolmogorov-Smirnov? Quando os resultados desses dois métodos serão diferentes?
Qual é a diferença entre o teste de normalidade Shapiro-Wilk e o teste de normalidade Kolmogorov-Smirnov? Quando os resultados desses dois métodos serão diferentes?
Respostas:
Você não pode nem comparar os dois, pois o Kolmogorov-Smirnov é para uma distribuição completamente especificada (por isso, se você estiver testando a normalidade, deverá especificar a média e a variação; elas não podem ser estimadas a partir dos dados *), enquanto o Shapiro-Wilk é de normalidade, com média e variância não especificadas.
* você também não pode padronizar usando parâmetros estimados e testar o padrão normal; isso é realmente a mesma coisa.
Uma maneira de comparar seria suplementar o Shapiro-Wilk com um teste para média e variância especificadas de forma normal (combinando os testes de alguma maneira) ou com as tabelas KS ajustadas para a estimativa de parâmetros (mas não haverá mais distribuição -livre).
Existe um teste desse tipo (equivalente ao Kolmogorov-Smirnov com parâmetros estimados) - o teste de Lilliefors; a versão do teste de normalidade pode ser validamente comparada à do Shapiro-Wilk (e geralmente terá uma potência mais baixa). Mais competitivo é o teste de Anderson-Darling (que também deve ser ajustado para a estimativa de parâmetros para que uma comparação seja válida).
Quanto ao que eles testam - o teste KS (e o Lilliefors) analisa a maior diferença entre o CDF empírico e a distribuição especificada, enquanto o Shapiro Wilk compara efetivamente duas estimativas de variação; o Shapiro-Francia intimamente relacionado pode ser considerado como uma função monotônica da correlação ao quadrado em um gráfico de QQ; se bem me lembro, o Shapiro-Wilk também leva em consideração covariâncias entre as estatísticas da ordem.
Editado para adicionar: Enquanto o Shapiro-Wilk quase sempre vence o teste de Lilliefors em alternativas de interesse, um exemplo em que não é o em amostras de médio e grande porte ( ). Lá, o Lilliefors tem maior poder.
[Deve-se ter em mente que existem muito mais testes de normalidade disponíveis do que esses.]
hist(replicate(1000,ks.test(scale(rnorm(x)),pnorm)$p.value))
- se os valores de p fossem como deveriam, isso pareceria uniforme!
Resumidamente, o teste de Shapiro-Wilk é um teste específico para normalidade, enquanto o método usado pelo teste de Kolmogorov-Smirnov é mais geral, mas menos poderoso (o que significa que rejeita corretamente a hipótese nula de normalidade com menos frequência). Ambas as estatísticas tomam a normalidade como nula e estabelecem uma estatística de teste com base na amostra, mas como elas são diferentes umas das outras de maneiras que as tornam mais ou menos sensíveis aos recursos das distribuições normais.
O cálculo exato de W (a estatística de teste para Shapiro-Wilk) é um pouco complicado , mas conceitualmente envolve a organização dos valores da amostra por tamanho e a medição do ajuste em relação às médias, variações e covariâncias esperadas. Essas múltiplas comparações com a normalidade, como eu a entendo, dão ao teste mais poder do que o teste de Kolmogorov-Smirnov, que é uma das maneiras pelas quais elas podem diferir.
Por outro lado, o teste de normalidade de Kolmogorov-Smirnov é derivado de uma abordagem geral para avaliar a qualidade do ajuste, comparando a distribuição cumulativa esperada com a distribuição cumulativa empírica, vis:
Como tal, é sensível no centro da distribuição, e não nas caudas. No entanto, o KS is test é convergente, no sentido de que, como n tende ao infinito, o teste converge para a verdadeira resposta em probabilidade (acredito que o Teorema de Glivenko-Cantelli se aplica aqui, mas alguém pode me corrigir). Existem mais duas maneiras pelas quais esses dois testes podem diferir na avaliação da normalidade.