Eu tenho lido o artigo de 2008 de Geoff Cumming, Replication Intervalos: os valores de prevêem o futuro apenas vagamente, mas os intervalos de confiança são muito melhores p p[~ 200 citações no Google Scholar] - e estou confuso com uma de suas alegações centrais. Este é um dos artigos em que Cumming argumenta contra os valores de e a favor de intervalos de confiança; minha pergunta, no entanto, não é sobre esse debate e diz respeito apenas a uma afirmação específica sobre os valores de .
Deixe-me citar o resumo:
Este artigo mostra que, se um experimento inicial resultar em bicaudal , há uma probabilidade de o valor unicaudal de uma replicação caia no intervalo , chance de que e chance de que . Notavelmente, o intervalo - denominado intervalo - é tão amplo quanto o tamanho da amostra.
Cumming afirma que esse " intervalo " e, de fato, toda a distribuição de valores- que se obteria ao replicar o experimento original (com o mesmo tamanho fixo de amostra), dependem apenas do valor- original e não dependa do tamanho real do efeito, potência, tamanho da amostra ou qualquer outra coisa:p p o b t
[...] a distribuição de probabilidade de pode ser derivada sem conhecer ou assumir um valor para (ou potência). [...] Não assumimos nenhum conhecimento prévio sobre e usamos apenas as informações [ observada entre grupos] fornecem sobre como base para o cálculo de um dado da distribuição de e de intervalos.
Estou confuso com isso porque, para mim, parece que a distribuição dos valores de depende fortemente do poder, enquanto o por si só não fornece nenhuma informação sobre isso. Pode ser que o tamanho real do efeito seja e a distribuição seja uniforme; ou talvez o tamanho real do efeito seja enorme e, portanto, deveríamos esperar valores de muito pequenos . Obviamente, pode-se começar com a suposição de alguns tamanhos de efeitos anteriores sobre possíveis e integrar sobre ele, mas Cumming parece afirmar que não é isso que ele está fazendo.p o b t δ = 0 p
Pergunta: O que exatamente está acontecendo aqui?
Observe que este tópico está relacionado a esta pergunta: Que fração das experiências repetidas terá um tamanho de efeito dentro do intervalo de confiança de 95% da primeira experiência? com uma excelente resposta de @whuber. Cumming tem um artigo sobre este tópico para: Cumming & Maillardet, 2006, Intervalos de confiança e replicação: onde cairá a próxima média? - mas esse é claro e sem problemas.
Também observo que a afirmação de Cumming é repetida várias vezes no artigo de 2015 Nature Methods. O valor inconstante de gera resultados irreprodutíveis que alguns de vocês podem ter encontrado (ele já tem ~ 100 citações no Google Scholar):
[...] haverá variação substancial no valor de experimentos repetidos. Na realidade, os experimentos raramente são repetidos; não sabemos quão diferente a próxima poderia ser. Mas é provável que possa ser muito diferente. Por exemplo, independentemente do poder estatístico de um experimento, se uma única réplica retornar um valor de , há uma chance de que um experimento repetido retorne um valor entre e (e uma alteração de [sic] que seria ainda maior).P P 0,05 80 % P 0 0,44 20 % P
(Observe, a propósito, como, independentemente de a afirmação de Cumming estar correta ou não, o artigo da Nature Methods a cita de maneira imprecisa: de acordo com Cumming, é apenas probabilidade acima de . E sim, o artigo diz "20% chan g e ". Pfff.)0,44