No R, tenho uma amostra de 348 medidas e quero saber se posso assumir que ela é normalmente distribuída para testes futuros.
Essencialmente, seguindo outra resposta da pilha , estou analisando o gráfico de densidade e o gráfico QQ com:
plot(density(Clinical$cancer_age))
qqnorm(Clinical$cancer_age);qqline(Clinical$cancer_age, col = 2)
Eu não tenho uma forte experiência em estatística, mas eles se parecem com exemplos de distribuições normais que eu já vi.
Então, eu estou executando o teste Shapiro-Wilk:
shapiro.test(Clinical$cancer_age)
> Shapiro-Wilk normality test
data: Clinical$cancer_age
W = 0.98775, p-value = 0.004952
Se eu interpretá-lo corretamente, ele me diz que é seguro rejeitar a hipótese nula, que é que a distribuição é normal.
No entanto, encontrei duas postagens de pilha ( aqui e aqui ), que minam fortemente a utilidade deste teste. Parece que se a amostra for grande (348 é considerada grande?), Sempre dirá que a distribuição não é normal.
Como devo interpretar tudo isso? Devo seguir o gráfico de QQ e assumir que minha distribuição é normal?