Por que os dados devem ser reamostrados sob hipótese nula no teste de hipótese de autoinicialização?

11

A aplicação direta dos métodos de bootstrap ao teste de hipóteses é estimar o intervalo de confiança da estatística de teste calculando-o repetidamente nas amostras com bootstrap (deixe que a estatística amostrada no bootstrap seja chamada ). Rejeitamos se o parâmetro hipotético (que geralmente é igual a 0) estiver fora do intervalo de confiança de . $\hat{\theta}$ $\hat{\theta}$ $\hat{\theta^*}$ $H_0$ $\theta_0$ $\hat{\theta^*}$

Eu li que esse método carece de algum poder. No artigo de Hall P. e Wilson SR "Duas Diretrizes para Teste de Hipóteses de Bootstrap" (1992) , está escrito como a primeira diretriz, que se deve reamostrar , não o . E esta é a parte que eu não entendo. $\hat{\theta^*} - \hat{\theta}$ $\hat{\theta^*} - \theta_0$

Não é que o mede apenas o viés do estimador ? Para estimadores imparciais, os intervalos de confiança dessa expressão sempre devem ser menores que , mas não vejo o que isso tem a ver com o teste de ? Não há nenhum lugar em que possamos ver informações sobre o . $\hat{\theta^*} - \hat{\theta}$ $\hat{\theta^*}$ $\hat{\theta^*} - \theta_0$ $\hat{\theta}=\theta_0$ $\theta_0$

Para aqueles de vocês que não têm acesso a este artigo, esta é uma citação do parágrafo relevante que vem imediatamente após a tese:

Para entender por que isso é importante, observe que o teste envolverá a rejeição de se em é "muito grande". Se estiver muito distante do valor verdadeiro de (ou seja, se for o erro grosseiro), a diferença nunca parecerá muito grande comparado à distribuição não-paramétrica de bootstrap de. Uma comparação mais significativa é com a distribuição de. De fato, se o valor verdadeiro de for $H_0$ $\left| \hat{\theta} - \theta_0\right|$ $\theta_0$ $\theta$ $H_0$ $\left|\hat{\theta} - \theta_0 \right|$ $\left| \hat{\theta} - \theta_0\right|$ $\left| \hat{\theta^*} - \hat{\theta}\right|$ $\theta$ $\theta_1$ então o poder do teste de autoinicialização aumenta para 1 comoaumenta, desde que o teste seja baseado na reamostragem , mas a potência diminui para no máximo o nível de significância (à medida que aumenta) se o teste for baseado em reamostragem $\left|\theta_1 - \theta_0\right|$ $\left| \hat{\theta^*} - \hat{\theta}\right|$ $\left|\theta_1 - \theta_0\right|$ $\left|\hat{\theta} - \theta_0\right|$

hypothesis-testing bootstrap

— Adam Ryczkowski
fonte

7

Este é o princípio da analogia de inicialização. A distribuição verdadeira (desconhecida) subjacente produziu uma amostra à mão com o cdf , que por sua vez produziu a estatística para alguns funcionais . Sua ideia de usar o bootstrap é fazer declarações sobre a distribuição de amostragem com base em uma distribuição conhecida , onde você tenta usar um protocolo de amostragem idêntico (que é exatamente possível apenas para dados iid; dados dependentes sempre levam a limitações de como com precisão, é possível reproduzir o processo de amostragem) e aplicar o mesmo funcional . Eu demonstrei em outro post $F$ $x_1, \ldots, x_n$ $F_n$ $\hat\theta=T(F_n)$ $T(\cdot)$ $\tilde F$ $T(\cdot)$ com (o que eu acho que é) um diagrama puro. Portanto, o análogo de bootstrap do desvio (amostragem + sistemático) , a quantidade de seu interesse central, é o desvio da replicação de bootstrap do que é conhecido como verdadeiro para a distribuição , o processo de amostragem aplicado e o funcional , ou seja, sua medida de tendência central é . Se você usou a autoinicialização não paramétrica padrão com substituição dos dados originais, seu , portanto, sua medida da tendência central deve ser base nos dados originais. $\hat\theta - \theta_0$ $\hat\theta^*$ $\tilde F$ $T(\cdot)$ $T(\tilde F)$ $\tilde F=F_n$ $T(F_n) \equiv \hat \theta$

Além da tradução, há problemas mais sutis nos testes de inicialização que às vezes são difíceis de superar. A distribuição de uma estatística de teste sob o nulo pode ser drasticamente diferente da distribuição da estatística de teste sob a alternativa (por exemplo, em testes nos limites do espaço do parâmetro que falham com o bootstrap ). Os testes simples que você aprende nas aulas de graduação, como o teste são invariantes durante o turno, mas pensar: "Caramba, eu mudo tudo" falha quando você precisa passar para o próximo nível de complexidade conceitual, os assintóticos . Pense nisso: você está testando e sua observada . Então, quando você constrói um $t$ $\chi^2$ $\mu=0$ $\bar x=0.78$ $\chi^2$ teste com o analógico de auto-inicialização , então este teste possui uma não centralidade embutida de desde o início, em vez de ser um teste central, como seria de esperar. Para tornar o teste de autoinicialização central, você realmente precisa subtrair a estimativa original. $(\bar x-\mu)^2/(s^2/n) \equiv \bar x^2/(s^2/n)$ $\bar x_*^2/(s_*^2/n)$ $n \bar x^2/s^2$

Os são inevitáveis em contextos multivariados, variando de Pearson para tabelas de contingência ao bootstrap de Bollen-Stine da estatística de teste em modelos de equações estruturais. O conceito de mudar a distribuição é extremamente difícil de definir bem nessas situações ... embora, no caso de testes nas matrizes de covariância multivariada, isso seja possível por uma rotação apropriada . $\chi^2$ $\chi^2$

— StasK
fonte

Obrigado. Há uma coisa que eu ainda não entendo: onde colocamos informações sobre

no bootstrap? Onde

é falso, o

pode estar consideravelmente fora da distribuição verdadeira.

θ_{0}

$\theta_0$

H_{0}

$H_0$

θ_{0}

$\theta_0$

— Adam Ryczkowski 2/11

Como você calcula o valor p sob o nulo, deve considerar o caso em que o

está em conformidade com o nulo. É claro que considerar a alternativa é uma alternativa, mas isso é ... uau ... isso seria um uso avançado da metodologia de teste de autoinicialização.

θ_{0}

$\theta_0$

— StasK

3

OK, entendi. Obrigado, StasK, por uma resposta tão boa. Vou mantê-lo aceito para que outros aprendam, mas, no meu caso particular, estava perdendo um fato muito simples:

O procedimento de bootstrap, de acordo com as diretrizes de Hall & Wilson para o teste médio de uma amostra simples, é este (no pseudo-código inspirado em R):

1function(data $\theta_0$ ) {
2 $\hat{\theta} \leftarrow$ t.test(data, mu = $\theta_0$ )$statistic
3 count $\leftarrow 0$
4for(i in 1:1000){
5 bdata $\leftarrow$ sample(data)
6 $\hat{\theta^*} \leftarrow$ t.test(bdata, mu = $\hat{\theta}$ )$statistic
7 if ( $\hat{\theta^*} \le \hat{\theta}$ ) count++
8 }
9 count/1000
10 }

$\theta_0$ 2 $\hat{\theta}$

26p.valuestatistic $\le$ $\ge$ 7

— Adam Ryczkowski
fonte

\hat{θ}

$\widehat{\theta}$

θ

$\theta$

θ_{0}

$\theta_0$

({\hat{θ}}^{*} - \hat{θ})

$( \widehat{\theta}^{*} - \widehat{\theta} )$

(\hat{θ} - θ_{0})

$( \widehat{\theta} - \theta_0 )$

1

Talvez útil: Michael Chernick forneceu uma intuição sucinta em resposta à minha pergunta relacionada aqui. stats.stackexchange.com/questions/289236/… )

— passe metade do dia