Morey et al (2015) argumentam que os intervalos de confiança são enganosos e existem vários vieses relacionados à compreensão deles. Entre outros, eles descrevem a falácia da precisão da seguinte maneira:
A falácia da precisão
A largura de um intervalo de confiança indica a precisão do nosso conhecimento sobre o parâmetro. Intervalos de confiança estreitos mostram conhecimento preciso, enquanto erros de confiança amplos mostram conhecimento impreciso.Não há conexão necessária entre a precisão de uma estimativa e o tamanho de um intervalo de confiança. Uma maneira de ver isso é imaginar dois pesquisadores - um pesquisador sênior e um estudante de doutorado - analisando dados de participantes de um experimento. Como um exercício para o benefício do aluno de doutorado, o pesquisador sênior decide dividir aleatoriamente os participantes em dois conjuntos de para que cada um possa analisar separadamente metade do conjunto de dados. Em uma reunião posterior, os dois compartilham um com o outro de seus alunos intervalos de confiança para a média. O IC do aluno de doutorado é e o IC do pesquisador sênior é .
O pesquisador sênior observa que seus resultados são amplamente consistentes e que eles poderiam usar a média ponderada de suas duas estimativas pontuais respectivas, , como uma estimativa geral da média verdadeira.
A aluna de doutorado, no entanto, argumenta que seus dois meios não devem ser uniformemente ponderados: ela observa que seu IC é metade da largura e argumenta que sua estimativa é mais precisa e, portanto, deve ser mais ponderada. Seu orientador observa que isso não pode estar correto, porque a estimativa de ponderar desigualmente as duas médias seria diferente da estimativa de analisar o conjunto de dados completo, que deve ser . O erro do aluno de doutorado é supor que os ICs indiquem diretamente a precisão pós-dados.
O exemplo acima parece ser enganoso. Se dividirmos aleatoriamente uma amostra ao meio, em duas amostras, esperamos que a média da amostra e os erros padrão estejam próximos. Nesse caso, não deve haver diferença entre o uso da média ponderada (por exemplo, ponderada por erros inversos) e a média aritmética simples. No entanto, se as estimativas diferirem e os erros em uma das amostras forem visivelmente maiores, isso poderá sugerir "problemas" nessa amostra.
Obviamente, no exemplo acima, os tamanhos das amostras são os mesmos, de modo que "juntar de volta" os dados calculando a média é o mesmo que calcular a média da amostra inteira. O problema é que o exemplo inteiro segue a lógica mal definida de que a amostra é primeiro dividida em partes e depois juntada novamente para a estimativa final.
O exemplo pode ser reformulado para levar exatamente à conclusão oposta:
O pesquisador e o aluno decidiram dividir o conjunto de dados em duas partes e analisá-los independentemente. Depois, eles compararam suas estimativas e parecia que a amostra significa que eles calculavam eram muito diferentes, além disso, o erro padrão da estimativa do aluno era muito maior. O aluno temia que isso pudesse sugerir problemas com a precisão de sua estimativa, mas o pesquisador sugeriu que não há conexão entre intervalos de confiança e precisão; portanto, ambas as estimativas são igualmente confiáveis e podem publicar qualquer uma delas, escolhida aleatoriamente, como sua estimativa final.
Em termos mais formais, os intervalos de confiança "padrão", como o de Student , são baseados em erros
onde é alguma constante. Nesse caso, eles estão diretamente relacionados à precisão, não são ..?
Então, minha pergunta é:
a falácia da precisão é realmente uma falácia? O que dizem os intervalos de confiança sobre precisão?
Morey, R., Hoekstra, R., Rouder, J., Lee, M., & Wagenmakers, E.-J. (2015). A falácia de confiar em intervalos de confiança. Boletim Psiconômico e Revisão, 1–21. https://learnbayes.org/papers/confidenceIntervalsFallacy/