Estou fazendo estudos de associação do GWAS SNP sobre doenças usando um software chamado plink ( http://pngu.mgh.harvard.edu/~purcell/plink/download.shtml ).
Com os resultados da associação, obtenho valores de p para todos os SNPs analisados. Agora, eu uso um gráfico QQ desses valores p para mostrar se um valor p muito baixo difere da distribuição esperada de valores p (uma distribuição uniforme). Se um valor p se desviar da distribuição esperada, um "poderá" chamar esse valor p para significância estatística.
Como você pode ver no gráfico QQ, no final da cauda, os últimos 4 pontos são um pouco difíceis de interpretar. Dois dos últimos pontos em cinza sugerem que esses valores p estão na distribuição esperada dos valores p, enquanto os outros dois não.
Agora, como interpretar isso, os dois últimos pontos têm valores de p mais baixos, mas não são "significativos" de acordo com o gráfico QQ, enquanto os outros dois pontos com valores de p mais altos são "significativos"? Como pode isto ser verdade?