Eu tive uma discussão com um estatístico em 2009, onde ele afirmou que o valor exato de um valor-p é irrelevante: a única coisa importante é se é significativo ou não. Ou seja, um resultado não pode ser mais significativo que outro; suas amostras, por exemplo, são da mesma população ou não.
Eu tenho algumas dúvidas com isso, mas talvez eu possa entender a ideologia:
O limite de 5% é arbitrário, ou seja, que p = 0,051 não é significativo e que p = 0,049 é, realmente não deve mudar a conclusão de sua observação ou experimento, apesar de um resultado ser significativo e o outro não significativo.
A razão pela qual eu trouxe isso à tona agora é que estou estudando para um mestrado em Bioinformática e, depois de conversar com pessoas da área, parece haver uma unidade determinada para obter um valor p exato para cada conjunto de estatísticas que eles fazem. Por exemplo, se eles 'atingirem' um valor p de p <1,9 × 10-12 , eles querem demonstrar o quão significativo é o resultado e que esse resultado é SUPER informativo. Esse problema foi exemplificado com perguntas como: Por que não consigo obter um valor p menor que 2.2e-16? , pelo qual eles desejam registrar um valor que indique que, por acaso, isso seria MUITO menor que 1 em um trilhão. Mas vejo pouca diferença em demonstrar que esse resultado ocorreria menos de 1 em um trilhão, em oposição a 1 em um bilhão.
Entendo, então, que p <0,01 mostra que há menos de 1% de chance de que isso ocorra, enquanto p <0,001 indica que um resultado como esse é ainda mais improvável do que o valor p mencionado, mas suas conclusões devem ser completamente diferente? Afinal, ambos são valores de p significativos. A única maneira de conceber querer registrar o valor p exato é durante uma correção de Bonferroni, na qual o limite muda devido ao número de comparações feitas, diminuindo o erro do tipo I. Mas, ainda assim, por que você gostaria de mostrar um valor-p que é 12 ordens de grandeza menor que a significância do seu limite?
E a aplicação da correção de Bonferroni também não é arbitrária? No sentido de que inicialmente a correção é vista como muito conservadora, e, portanto, existem outras que podem ser escolhidas para acessar o nível de significância que o observador poderia usar para suas múltiplas comparações. Mas, por causa disso, não é o ponto em que algo se torna substancialmente variável, dependendo de quais estatísticas o pesquisador deseja usar. As estatísticas devem ser tão abertas à interpretação?
Em conclusão, as estatísticas não deveriam ser menos subjetivas (embora eu ache que a necessidade de serem subjetivas seja uma conseqüência de um sistema multivariado), mas, em última análise, quero esclarecimentos: algo pode ser mais significativo do que alguma outra coisa? E p <0,001 será suficiente em relação à tentativa de registrar o valor p exato?