Hipóteses nulas exemplificam o significado de "Todos os modelos estão errados, mas alguns são úteis". São provavelmente mais úteis se não forem tomadas literalmente e fora de contexto - ou seja, é importante lembrar o objetivo epistêmico do nulo. Se puder ser falsificado, que é o objetivo pretendido, a alternativa se tornará mais útil por comparação, embora ainda pouco informativa. Se você rejeitar o nulo, estará dizendo que o efeito provavelmente não é zero (ou seja o que for - hipóteses nulas também podem especificar outros valores para falsificação) ... então o que é então?
O tamanho do efeito que você calcula é sua melhor estimativa de ponto do parâmetro populacional. Geralmente, as chances devem ser igualmente boas de que seja superestimada ou subestimada, mas as chances de ser um ponto de parada são infinitesimais, como o comentário de @ Glen_b implica. Se por alguma reviravolta bizarra do destino (ou por construção - de qualquer maneira, suponho que estamos falando hipoteticamente?) Sua estimativa cai diretamente em , ainda não há muita evidência de que o parâmetro não seja um valor diferente dentro o intervalo de confiança. O significado do intervalo de confiança não muda com base na significância de qualquer teste de hipótese, exceto na medida em que pode alterar a localização e a largura de maneira relacionada.0.0¯
Caso você não esteja familiarizado com a aparência das estimativas de tamanho de efeito para amostras de uma população (simulada) cuja hipótese nula é literalmente verdadeira (ou caso você ainda não a tenha visto e esteja aqui apenas para um pouco de entretenimento estatístico) ), confira Dança dos valoresp Geoff Cumming . Caso esses intervalos de confiança não sejam estreitos o suficiente para o seu gosto, tentei simular alguns em R usando amostras geradas aleatoriamente com apenas cada de . Eu esqueci de colocar uma semente, mas coloquei e depois corri quantas vezes quisesse antes de terminar esta resposta, o que me deu 6000 amostras no final. Aqui está um histograma e um gráfico de densidade usando en=1MN(0,1)x=c()
x=append(x,replicate(500,cor(rnorm(999999),rnorm(999999))))
hist(x,n=length(x)/100)
plot(density(x))
, respectivamente:
Como seria de esperar, existem evidências de uma variedade de efeitos diferentes de zero resultantes dessas amostras aleatórias de uma população com efeito literalmente zero, e essas estimativas são distribuídas mais ou menos normalmente em torno do parâmetro true ( skew(x)
= -.005, kurtosis(x)
= 2.85). Imagine que você só conheceu o valor da sua estimativa a partir de uma amostra de , e não o parâmetro verdadeiro: por que você esperaria que o parâmetro estivesse mais próximo de zero do que a sua estimativa e não mais? Seu intervalo de confiança pode incluir o nulo, mas o nulo não é realmente mais plausível que o valor da distância equivalente ao tamanho do efeito de amostra na direção oposta, e outros valores podem ser mais plausíveis que isso, especialmente sua estimativa de pontos!n=1M
Se, na prática, você deseja demonstrar que um efeito é mais ou menos zero, precisa definir quanto mais ou menos você está inclinado a ignorar. Com essas enormes amostras que simulei, a estimativa da maior magnitude que gerei foi . Com amostras mais realistas de , a maior que encontro entre as amostras de é . Novamente, os resíduos são normalmente distribuídos, portanto são improváveis, mas o ponto é que eles não são implausíveis.|r|=.004n=9991M|r|=.14
Um IC é provavelmente mais útil para inferência do que um NHST em geral. Ele não representa apenas o quão ruim pode ser a idéia de assumir que o parâmetro é insignificante; representa uma boa idéia do que realmente é o parâmetro. Ainda se pode decidir se isso é insignificante, mas também é possível ter uma noção de quão insignificante pode ser. Para defesa adicional de intervalos de confiança, consulte Cumming (2014 , 2013) .
Referências
- Cumming, G. (2013). Entendendo as novas estatísticas: tamanhos de efeito, intervalos de confiança e metanálise . Routledge.
- Cumming, G. (2014). As novas estatísticas: por que e como. Psychological Science, 25 (7), 7–29. Recuperado em http://pss.sagepub.com/content/25/1/7.full.pdf+html .