Em A insignificância do teste de significância , Johnson (1999) observou que os valores de p são arbitrários, na medida em que você pode torná-los tão pequenos quanto desejar reunindo dados suficientes, assumindo que a hipótese nula é falsa, o que quase sempre é. No mundo real, é improvável que haja correlações semi-parciais que sejam exatamente zero, que é a hipótese nula no teste de significância de um coeficiente de regressão. Os pontos de corte do valor-p são ainda mais arbitrários. O valor de 0,05 como ponto de corte entre significância e não-significância é usado por convenção, não por princípio. Portanto, a resposta para sua primeira pergunta é não, não há uma maneira de decidir por um limite de significância apropriado.
Então, o que você pode fazer, considerando seu grande conjunto de dados? Depende do (s) motivo (s) para explorar a significância estatística de seus coeficientes de regressão. Você está tentando modelar um sistema multifatorial complexo e desenvolver uma teoria útil que se encaixe ou preveja razoavelmente a realidade? Talvez você possa pensar em desenvolver um modelo mais elaborado e adotar uma perspectiva de modelagem, como descrito em Rodgers (2010), A Epistemologia da Modelagem Matemática e Estatística . Uma vantagem de ter muitos dados é poder explorar modelos muito ricos, com vários níveis e interações interessantes (supondo que você tenha as variáveis para fazê-lo).
Se, por outro lado, você quiser julgar se deve tratar um coeficiente em particular como estatisticamente significativo ou não, convém considerar a sugestão de Good (1982) como resumida em Woolley (2003) : Calcular o valor q como que padroniza os valores p para um tamanho de amostra de 100. Um valor p de exatamente 0,001 converte-se em um valor p de 0,045 - ainda estatisticamente significativo.p⋅(n/100)−−−−−−√
Então, se é significativo usar um limite arbitrário ou outro, e daí? Se este é um estudo observacional, você tem muito mais trabalho para justificar que é realmente significativo da maneira que pensa e não apenas um relacionamento falso que aparece porque você especificou incorretamente o seu modelo. Observe que um efeito pequeno não é tão clinicamente interessante se representar diferenças pré-existentes entre as pessoas que selecionam níveis diferentes de tratamento, em vez de um efeito de tratamento.
Você precisa considerar se o relacionamento que está vendo é praticamente significativo, como observaram os comentaristas. Converter os números que você cita de para r 2 para a variação explicada ( r é correlação, quadrado para obter variação explicada) fornece apenas 3 e 6% de variação explicada, respectivamente, o que não parece muito.rr2r