Teste de hipóteses versus estimativa de parâmetros
Normalmente, as hipóteses são estruturadas de maneira binária. Vou colocar hipóteses direcionais de lado, pois elas não mudam muito a questão. É comum, pelo menos em psicologia, falar de hipóteses como: a diferença entre médias de grupo é ou não é zero; a correlação é ou não é zero; o coeficiente de regressão é ou não é zero; o quadrado r é ou não é zero. Em todos esses casos, existe uma hipótese nula de nenhum efeito e uma hipótese alternativa de um efeito.
Esse pensamento binário geralmente não é o que mais interessa. Quando você pensa na sua pergunta de pesquisa, quase sempre descobre que está realmente interessado em estimar parâmetros. Você está interessado na diferença real entre médias de grupo, ou o tamanho da correlação, ou o tamanho do coeficiente de regressão, ou a quantidade de variação explicada.
Obviamente, quando obtemos uma amostra de dados, a estimativa amostral de um parâmetro não é a mesma que o parâmetro populacional. Portanto, precisamos de uma maneira de quantificar nossa incerteza sobre qual pode ser o valor do parâmetro. De uma perspectiva freqüentista, os intervalos de confiança fornecem um meio de fazer, embora os puristas bayesianos possam argumentar que eles não permitem estritamente a inferência que você pode querer fazer. De uma perspectiva bayesiana, intervalos credíveis nas densidades posteriores fornecem um meio mais direto de quantificar sua incerteza sobre o valor de um parâmetro populacional.
Parâmetros / tamanhos de efeito
Afastar-se da abordagem de teste de hipótese binária força você a pensar de maneira contínua. Por exemplo, que diferença de tamanho em médias de grupo seria teoricamente interessante? Como você mapearia a diferença entre as médias do grupo em linguagem subjetiva ou implicações práticas? Medidas padronizadas de efeito, juntamente com normas contextuais, são uma maneira de construir uma linguagem para quantificar o que significam diferentes valores de parâmetros. Tais medidas são frequentemente rotuladas como "tamanhos de efeito" (por exemplo, d, r, Cohen , etc.). No entanto, é perfeitamente razoável, e geralmente preferível, falar sobre a importância de um efeito usando medidas não padronizadas (por exemplo, a diferença de grupo significa em variáveis não padronizadas significativas, como níveis de renda, expectativa de vida, etc.).R2
Há uma enorme literatura em psicologia (e outros campos) criticando o foco em valores-p, testes de significância de hipóteses nulas e assim por diante (consulte esta pesquisa no Google Scholar ). Essa literatura geralmente recomenda o tamanho dos efeitos do relatório com intervalos de confiança como uma resolução (por exemplo, força-tarefa da APA de Wilkinson, 1999).
Etapas para se afastar do teste de hipótese binária
Se você está pensando em adotar esse pensamento, acho que existem abordagens progressivamente mais sofisticadas que você pode adotar:
- Abordagem 1a. Relate a estimativa pontual do seu efeito amostral (por exemplo, diferenças médias do grupo) em termos brutos e padronizados. Quando você relatar seus resultados, discuta o que essa magnitude significaria para a teoria e a prática.
- Abordagem 1b. Adicione a 1a, pelo menos em um nível muito básico, um pouco da incerteza em torno da estimativa de parâmetros com base no tamanho da amostra.
- Abordagem 2. Informe também os intervalos de confiança nos tamanhos dos efeitos e incorpore essa incerteza ao seu pensamento sobre os valores plausíveis do parâmetro de interesse.
- Abordagem 3. Relate intervalos credíveis bayesianos e examine as implicações de várias suposições nesse intervalo credível, como a escolha do anterior, o processo de geração de dados implícito no seu modelo e assim por diante.
Entre muitas referências possíveis, você verá Andrew Gelman falando muito sobre essas questões em seu blog e em sua pesquisa.
Referências
- Nickerson, RS (2000). Teste de significância de hipótese nula: uma revisão de uma controvérsia antiga e contínua. Métodos psicológicos, 5 (2), 241.
- Wilkinson, L. (1999). Métodos estatísticos em periódicos de psicologia: orientações e explicações. Psicólogo americano, 54 (8), 594. PDF