Como se pode calcular intervalos de confiança para valores-p e como o oposto da estimativa de intervalo é a estimativa pontual: O valor-p é uma estimativa pontual?
Como se pode calcular intervalos de confiança para valores-p e como o oposto da estimativa de intervalo é a estimativa pontual: O valor-p é uma estimativa pontual?
Respostas:
As estimativas pontuais e os intervalos de confiança são para parâmetros que descrevem a distribuição, por exemplo, média ou desvio padrão.
Porém, diferentemente de outras estatísticas da amostra, como a média da amostra e o desvio padrão da amostra, o valor p não é um estimador útil de um parâmetro de distribuição interessante. Veja a resposta de @whuber para obter detalhes técnicos.
O valor-p para uma estatística de teste fornece a probabilidade de observar um desvio do valor esperado da estatística de teste tão grande quanto o observado na amostra, calculado sob a suposição de que a hipótese nula é verdadeira. Se você tiver toda a distribuição, ela é consistente com a hipótese nula ou não. Isso pode ser descrito com a variável indicadora (novamente, veja a resposta por @whuber).
Mas o valor p não pode ser usado como um estimador útil da variável do indicador, porque não é consistente, pois o valor p não converge à medida que o tamanho da amostra aumenta se a hipótese nula for verdadeira. Essa é uma maneira alternativa bastante complicada de afirmar que um teste estatístico pode rejeitar ou deixar de rejeitar o nulo, mas nunca o confirma.
Sim, poderia ser (e tem sido) argumentado que um valor-p é uma estimativa pontual.
Para identificar qualquer propriedade de uma distribuição que um valor-p possa estimar, teríamos que assumir que é assintoticamente imparcial. Mas, assimptoticamente, a p-valor médio para a hipótese nula é (idealmente, para alguns testes que poderia ser algum outro número diferente de zero) e para qualquer outra hipótese é 0 . Assim, o valor-p pode ser considerado um estimador de metade da função do indicador para a hipótese nula.
É certo que é preciso alguma criatividade para visualizar um valor-p dessa maneira. Poderíamos fazer um pouco melhor vendo o estimador em questão como a decisão que tomamos por meio do valor-p: a distribuição subjacente é um membro da hipótese nula ou da hipótese alternativa? Vamos chamar esse conjunto de possíveis decisões . Jack Kiefer escreve
Supomos que exista um experimento cujo resultado o estatístico possa observar. Este resultado é descrito por uma variável aleatória ou vetor aleatório .... A lei de probabilidade de X é desconhecida pelo estatístico, mas sabe-se que a função de distribuição F de X é membro de uma classe especificada Ω de funções de distribuição. ...
Diz-se que um problema estatístico é um problema de estimativa pontual se é a coleção de possíveis valores de alguma propriedade real ou com valor vetorial de F que depende de F de uma maneira razoavelmente suave.
Nesse caso, como é discreto, "razoavelmente suave" não é uma restrição. A terminologia de Kiefer reflete isso referindo-se a procedimentos estatísticos com espaços de decisão discretos como "testes" em vez de "estimadores pontuais".
Embora seja interessante explorar os limites (e limitações) de tais definições, como esta pergunta nos convida a fazer, talvez não devamos insistir muito fortemente que um valor-p é um estimador de pontos, porque essa distinção entre estimadores e testes é tanto útil e convencional.
Em um comentário a essa pergunta, Christian Robert chamou a atenção para um artigo de 1992 em que ele e os co-autores adotaram exatamente esse ponto de vista e analisaram a admissibilidade do valor-p como estimador da função do indicador . Veja o link nas referências abaixo. O artigo começa,
As abordagens para o teste de hipóteses geralmente tratam o problema do teste como um processo de tomada de decisão e não de estimativa. Mais precisamente, um teste formal de hipótese resultará em uma conclusão sobre se uma hipótese é verdadeira e não fornecerá uma medida de evidência para associar a essa conclusão. Neste artigo , consideramos o teste de hipóteses como um problema de estimativa dentro de uma estrutura teórica da decisão ....
[Enfase adicionada.]
Jiunn Tzon Hwang, George Casella, Christian Robert, Martin T. Wells e Roger H. Farrell, Estimação de precisão em testes . Ann. Statist. Volume 20, Número 1 (1992), 490-509. Acesso aberto .
Jack Carl Kiefer, Introdução à Inferência Estatística . Springer-Verlag, 1987.