Por que precisamos do Bootstrapping?

16

Atualmente, estou lendo "All of Statistics", de Larry Wasserman, e intrigado com algo que ele escreveu no capítulo sobre estimativa de funções estatísticas de modelos não paramétricos.

Ele escreveu

"Às vezes, podemos encontrar o erro padrão estimado de uma função estatística fazendo alguns cálculos. No entanto, em outros casos, não é óbvio como estimar o erro padrão".

Gostaria de salientar que, no próximo capítulo, ele fala sobre o bootstrap para resolver esse problema, mas como eu realmente não entendo essa afirmação, não recebo totalmente o incentivo por trás do bootstrapping?

Que exemplo existe quando não é óbvio como estimar o erro padrão?

Todos os exemplos que eu vi até agora têm sido "óbvio" como $X_1,...X_n ~Ber(p)$ , em seguida, $\hat{se}(\hat{p}_n )=\sqrt{\hat{p}\cdot(1-\hat{p})/n}$

— Shookie
fonte

4

Estou encontrando muitos exemplos em uma pesquisa no site por outras respostas que propõem uma inicialização . Eles incluem stats.stackexchange.com/questions/14213 , stats.stackexchange.com/questions/63979 , stats.stackexchange.com/questions/25218 e muito mais.

— whuber

16

Duas respostas

Qual é o erro padrão da razão de duas médias? Qual é o erro padrão da mediana? Qual é o erro padrão de qualquer estatística complexa? Talvez exista uma equação de forma fechada, mas é possível que ninguém tenha trabalhado ainda.
Para usar a fórmula (digamos) do erro padrão da média, precisamos fazer algumas suposições. Se essas suposições forem violadas, não podemos necessariamente usar o método. Como o @Whuber aponta nos comentários, o bootstrap permite relaxar algumas dessas suposições e, portanto, pode fornecer erros padrão mais apropriados (embora também possa fazer suposições adicionais).

— Jeremy Miles
fonte

2

A resposta 1 está correta, mas a resposta 2 parece implorar a pergunta, porque o bootstrapping também faz suposições. Suponho que o argumento possa ser que ele normalmente faz suposições diferentes de outros procedimentos populares, mas esse é apenas o meu palpite sobre o que você está tentando dizer e posso estar enganado.

— whuber

@ Whuber - obrigado, eu adicionei um pouco de esclarecimento.

— Jeremy Miles

5

Obrigado pelas edições. Mas não é o caso de o bootstrap tipicamente fazer suposições diferentes , em vez de realmente relaxar algumas? Por exemplo, as suposições necessárias para estimar um SE de uma média da amostra são que os dados são iid e a distribuição subjacente tem uma variação finita. O bootstrap realmente precisa adicionar suposições neste caso: não funciona a menos que o tamanho da amostra seja "suficientemente grande". Embora isso possa parecer uma piada sobre aspectos técnicos, o que estou tentando abordar é o quadro geral: o bootstrapping não é uma panacéia nem sempre é aplicável.

— whuber

3

@ JeremyMiles o bootstrap não está livre de suposições. Você precisa verificar se a distribuição é essencial para a maioria dos cálculos de erro de autoinicialização, que geralmente podem ser mais complicados do que obter um estimador consistente para um erro padrão. Além disso, a razão de médias tem uma aproximação de erro muito fácil obtida pelo método δ. Portanto, não acho que esse exemplo desafie o argumento do OP.

— AdamO 29/05

9

Um exemplo pode ajudar a ilustrar. Suponha que, em um quadro de modelagem causal, você está interessado em determinar se a relação entre (uma exposição de interesse) um (um resultado de interesse) é mediada por uma variável . Isso significa que nos dois modelos de regressão: $X$ $Y$ $W$

\begin{array}{rcl} E [Y | X] & = & β_{0} + β_{1} X \\ E [Y | X, W] & = & γ_{0} + γ_{1} X + γ_{2} W \end{array}

$\begin{eqnarray} E[Y|X] &=& \beta_0 + \beta_1 X \\ E[Y|X, W] &=& \gamma_0 + \gamma_1 X + \gamma_2 W \\ \end{eqnarray}$

O efeito é diferente do efeito . $\beta_1$ $\gamma_1$

Como exemplo, considere a relação entre tabagismo e risco cardiovascular (CV). Obviamente, fumar aumenta o risco de CV (para eventos como ataque cardíaco e derrame), fazendo com que as veias se tornem quebradiças e calcificadas. No entanto, fumar também é um inibidor de apetite. Portanto, estaríamos curiosos se a relação estimada entre tabagismo e risco CV é mediada pelo IMC, que independentemente é um fator de risco para o risco CV. Aqui pode ser um evento binário (infarto do miocárdio ou neurológico) em um modelo de regressão logística ou uma variável contínua como calcificação arterial coronariana (CAC), fração de ejeção do ventrículo esquerdo (FEVE) ou massa do ventrículo esquerdo (MVE). $Y$

Ajustaríamos dois modelos 1: ajustar o tabagismo e o resultado, juntamente com outros fatores de confusão, como idade, sexo, renda e histórico familiar de doença cardíaca, em seguida 2: todas as covariáveis anteriores, bem como o índice de massa corporal. A diferença no efeito de fumar entre os modelos 1 e 2 é onde baseamos nossa inferência.

Estamos interessados em testar as hipóteses

\begin{array}{rcl} H & : & β_{1} = γ_{1} \\ K & : & β_{1} \neq γ_{1} \end{array}

$\begin{eqnarray} \mathcal{H} &:& \beta_1 = \gamma_1\\ \mathcal{K} &:& \beta_1 \ne \gamma_1\\ \end{eqnarray}$

Uma medida de efeito possível pode ser: ou ou qualquer número de medições. Você pode usar os estimadores usuais para e . O erro padrão desses estimadores é muito complicado de derivar. A inicialização da distribuição deles, no entanto, é uma técnica comumente aplicada, e é fácil calcular o valor- diretamente disso. $T = \beta_1 - \gamma_1$ $S = \beta_1 / \gamma_1$ $T$ $S$ $p$

— AdamO
fonte

T

$T$

S

$S$

T

$T$

S

$S$

T

$T$

S

$S$

γ_{2} = 0

$\gamma_2 = 0$

@ whuber Ah eu vejo a confusão. Consulte um artigo recomendado da MacKinnon aqui .

— AdamO

T

$T$

S

$S$

T

$T$

T

$T$

T

$T$

2

Ter soluções paramétricas para cada medida estatística seria desejável, mas, ao mesmo tempo, bastante irrealista. O Bootstrap é útil nesses casos. O exemplo que me vem à mente diz respeito à diferença entre dois meios de distribuição de custos altamente distorcida. Nesse caso, o teste t clássico de duas amostras não atende aos seus requisitos teóricos (as distribuições das quais as amostras investigadas foram retiradas certamente se afastam da normalidade, devido à longa cauda direita) e os testes não paramétricos não são capazes de transmitir informações úteis para os tomadores de decisão (que geralmente não estão interessados nas fileiras). Uma solução possível para evitar ser interrompido nesse problema é um teste t de inicialização de duas amostras.

— Carlo Lazzaro
fonte