Penso que os testes de normalidade podem ser úteis como companheiros de exames gráficos. Eles precisam ser usados da maneira certa, no entanto. Na minha opinião, isso significa que muitos testes populares, como os testes Shapiro-Wilk, Anderson-Darling e Jarque-Bera, nunca devem ser usados.
Antes de explicar meu ponto de vista, deixe-me fazer algumas observações:
- Em um artigo recente interessante, Rochon et al. estudaram o impacto do teste Shapiro-Wilk no teste t de duas amostras. O procedimento de duas etapas para testar a normalidade antes de realizar, por exemplo, um teste t não apresenta problemas. Por outro lado, o procedimento de duas etapas também não é investigar graficamente a normalidade antes de realizar um teste t. A diferença é que o impacto deste último é muito mais difícil de investigar (pois exigiria que um estatístico investigasse graficamente a normalidade vezes mais ou menos ...).100,000
- É útil quantificar a não normalidade , por exemplo, computando a assimetria da amostra, mesmo que você não queira executar um teste formal.
- A normalidade multivariada pode ser difícil de avaliar graficamente e a convergência para distribuições assintóticas pode ser lenta para estatísticas multivariadas. Os testes de normalidade são, portanto, mais úteis em uma configuração multivariada.
- Os testes de normalidade talvez sejam especialmente úteis para profissionais que usam estatísticas como um conjunto de métodos de caixa preta . Quando a normalidade é rejeitada, o profissional deve ficar alarmado e, em vez de executar um procedimento padrão baseado na suposição de normalidade, considere usar um procedimento não paramétrico, aplicar uma transformação ou consultar um estatístico mais experiente.
- Como já foi apontado por outros, se for grande o suficiente, o CLT geralmente salva o dia. No entanto, o que é "grande o suficiente" difere para diferentes classes de distribuições.n
(Na minha definição), um teste de normalidade é direcionado contra uma classe de alternativas se for sensível a alternativas dessa classe, mas não sensível a alternativas de outras classes. Exemplos típicos são testes que são direcionados para alternativas inclinadas ou kurtóticas . Os exemplos mais simples usam a assimetria e curtose da amostra como estatísticas de teste.
Testes dirigidos de normalidade são, sem dúvida, preferíveis a testes omnibus (como os testes de Shapiro-Wilk e Jarque-Bera), uma vez que é comum que apenas alguns tipos de não normalidade sejam motivo de preocupação para um procedimento inferencial específico .
Vamos considerar o teste t de Student como um exemplo. Suponha que tenhamos uma amostra iid de uma distribuição com assimetria e (excesso) de curtoseSe é simétrico em relação à sua média, . Ambos e são 0 para a distribuição normal.γ=E(X−μ)3σ3κ=E(X−μ)4σ4−3.Xγ=0γκ
Sob premissas de regularidade, obtemos a seguinte expansão assintótica para o cdf da estatística de teste :
TnP(Tn≤x)=Φ(x)+n−1/216γ(2x2+1)ϕ(x)−n−1x(112κ(x2−3)−118γ2(x4+2x2−3)−14(x2+3))ϕ(x)+o(n−1),
onde é o cdf e é o pdf da distribuição normal padrão.Φ(⋅)ϕ(⋅)
γ aparece pela primeira vez no termo , enquanto aparece no termo . O desempenho assintótico de é muito mais sensível a desvios da normalidade na forma de assimetria do que na forma de curtose.n−1/2κn−1Tn
Pode-se verificar usando simulações que isso também é verdade para pequenos . Portanto, o teste t de Student é sensível à assimetria, mas relativamente robusto contra caudas pesadas, e é razoável usar um teste de normalidade direcionado para alternativas de inclinação antes de aplicar o teste t .n
Como regra geral ( não uma lei da natureza), a inferência sobre meios é sensível à assimetria e a inferência sobre variações é sensível à curtose.
O uso de um teste direcionado para a normalidade tem o benefício de obter maior poder contra alternativas '' perigosas '' e menor poder contra alternativas menos '' perigosas '', o que significa que somos menos propensos a rejeitar a normalidade por causa de desvios da normalidade vencidos afeta o desempenho do nosso procedimento inferencial. A não normalidade é quantificada de maneira relevante para o problema em questão. Nem sempre é fácil fazer isso graficamente.
À medida que aumenta, a assimetria e a curtose se tornam menos importantes - e é provável que testes diretos detectem se essas quantidades divergem de 0, mesmo que em pequena quantidade. Nesses casos, parece razoável, por exemplo, testar se ou (observando o primeiro termo da expansão acima) vez de se . Isso cuida de alguns dos problemas que, de outra forma, enfrentamos à medida que aumenta.n|γ|≤1|n−1/216γ(2z2α/2+1)ϕ(zα/2)|≤0.01
γ=0n