Qual é o significado de um intervalo de confiança extraído de reamostragens inicializadas?

Estive analisando várias perguntas neste site sobre intervalos de inicialização e confiança, mas ainda estou confuso. Parte do motivo da minha confusão é provavelmente o fato de eu não ter avançado o suficiente em meus conhecimentos estatísticos para entender muitas respostas. Eu estou na metade do curso introdutório de estatística e meu nível de matemática é apenas no meio da álgebra II, então qualquer coisa além desse nível me confunde. Se uma das pessoas com conhecimento neste site pudesse explicar esse problema no meu nível, seria extremamente útil.

Estávamos aprendendo em sala de aula como tirar novas amostras usando o método de autoinicialização e usá-las para criar um intervalo de confiança para algumas estatísticas que gostaríamos de medir. Por exemplo, digamos que coloquemos uma amostra de uma grande população e constatemos que 40% dizem que votarão no candidato A. Supomos que essa amostra seja um reflexo bastante preciso da população original; nesse caso, podemos obter novas amostras de para descobrir algo sobre a população. Então, fazemos uma nova amostra e descobrimos (usando um nível de confiança de 95%) que o intervalo de confiança resultante varia de 35% a 45%.

Minha pergunta é: o que esse intervalo de confiança realmente significa ?

Eu continuo lendo que há uma diferença entre Intervalos de Confiança (Frequentistas) e Intervalos Credíveis (Bayesianos). Se eu entendi corretamente, um intervalo credível diria que há uma chance de 95% de que, em nossa situação, o parâmetro true esteja dentro do intervalo determinado (35% -45%), enquanto um intervalo de confiança diria que há 95% nesse tipo de situação (mas não necessariamente em nossa situação especificamente), o método que estamos usando informaria com precisão que o parâmetro true está dentro do intervalo especificado.

Supondo que essa definição esteja correta, minha pergunta é: Qual é o "parâmetro verdadeiro" sobre o qual estamos falando ao usar intervalos de confiança criados usando o método de autoinicialização? Estamos nos referindo a (a) parâmetro verdadeiro da população original ou (b) parâmetro verdadeiro da amostra ? Se (a), estaríamos dizendo que 95% das vezes o método de autoinicialização relatará com precisão declarações verdadeiras sobre a população original. Mas como poderíamos saber disso? Todo o método de inicialização não se baseia na suposiçãoque a amostra original é um reflexo preciso da população da qual foi retirada? Se (b), então eu não entendo o significado do intervalo de confiança. Já não sabemos o verdadeiro parâmetro da amostra? É uma medida direta!

Eu discuti isso com minha professora e ela foi bastante útil. Mas ainda estou confuso.

confidence-interval bootstrap

— iarwain
fonte

Respostas:

Se o procedimento de inicialização e a formação do intervalo de confiança foram executados corretamente, significa o mesmo que qualquer outro intervalo de confiança. De uma perspectiva freqüentista, um IC de 95% implica que, se todo o estudo for repetido de forma idêntica ad infinitum , 95% desses intervalos de confiança formados dessa maneira incluirão o valor real. Obviamente, no seu estudo ou em qualquer estudo individual, o intervalo de confiança incluirá o valor verdadeiro ou não, mas você não saberá qual. Para entender melhor essas idéias, pode ser útil ler minha resposta aqui: Por que um intervalo de confiança de 95% (IC) não implica 95% de chance de conter a média?

Em relação às suas perguntas adicionais, o "valor verdadeiro" refere-se ao parâmetro real da população relevante. (As amostras não têm parâmetros, elas têm estatísticas ; por exemplo, a média da amostra, , é uma estatística da amostra, mas a média da população, , é um parâmetro da população.) Quanto à forma como sabemos disso, na prática nós não. Você está certo de que estamos confiando em algumas suposições - sempre estamos. Se essas suposições estiverem corretas, pode-se provar que as propriedades são válidas. Esse foi o objetivo do trabalho de Efron no final dos anos 70 e início dos anos 80, mas a matemática é difícil para a maioria das pessoas. Para uma explicação matemática do bootstrap, consulte a resposta do @ StasK aqui: Explicando aos leigos por que o bootstrap funciona $\bar x$ $\mu$ . Para uma rápida demonstração curta da matemática, considere a seguinte simulação usando R:

# a function to perform bootstrapping
boot.mean.sampling.distribution = function(raw.data, B=1000){
  # this function will take 1,000 (by default) bootsamples calculate the mean of 
  # each one, store it, & return the bootstrapped sampling distribution of the mean

  boot.dist = vector(length=B)     # this will store the means
  N         = length(raw.data)     # this is the N from your data
  for(i in 1:B){
    boot.sample  = sample(x=raw.data, size=N, replace=TRUE)
    boot.dist[i] = mean(boot.sample)
  }
  boot.dist = sort(boot.dist)
  return(boot.dist)
}

# simulate bootstrapped CI from a population w/ true mean = 0 on each pass through
# the loop, we will get a sample of data from the population, get the bootstrapped 
# sampling distribution of the mean, & see if the population mean is included in the
# 95% confidence interval implied by that sampling distribution

set.seed(00)                       # this makes the simulation reproducible
includes = vector(length=1000)     # this will store our results
for(i in 1:1000){
  sim.data    = rnorm(100, mean=0, sd=1)
  boot.dist   = boot.mean.sampling.distribution(raw.data=sim.data)
  includes[i] = boot.dist[25]<0 & 0<boot.dist[976]
}
mean(includes)     # this tells us the % of CIs that included the true mean
[1] 0.952

— - Reinstate Monica
fonte

Em que suposições específicas estamos confiando?

— iarwain

Obrigado. Acho que encontrei o que estava procurando na segunda resposta a esse tópico: "Lembre-se de que não estamos usando os meios das amostras de autoinicialização para estimar a média da população, usamos a média da amostra para isso (ou qualquer que seja a estatística de interesse Mas estamos usando as amostras de bootstrap para estimar propriedades (propagação, viés) do processo de amostragem e usando amostragem de uma população conhecida (que esperamos que seja representativa da população de interesse) para aprender os efeitos da amostragem. e é muito menos circular ". ...

— iarwain

... Em outras palavras, tudo o que o IC está nos dizendo é que, em uma população aproximadamente semelhante à nossa, esperaríamos que 95% das amostras colhidas nessa população refletissem o valor real +/- da margem de erro. Então, tudo o que estamos fazendo é fornecer uma pista muito aproximada - embora talvez a melhor pista que tenhamos - para determinar quão perto nossa estatística de amostra pode estar do verdadeiro parâmetro populacional. Nesse caso, parece que não devemos levar muito a sério os números exatos no IC - eles apenas significam algo como "a estatística da amostra provavelmente é aproximadamente precisa até provavelmente esse grau". Eu entendi direito?

— Iarwain

Isso é essencialmente correto. Um IC fornece uma noção da precisão de nossa estimativa, mas nunca sabemos se o IC (realizado) real contém o valor verdadeiro. A suposição primária é que nossos dados são representativos da população de interesse. Observe que nenhum deles é específico para ICs inicializados , você tem a mesma interpretação e suposição em um IC calculado via teoria assintótica.

— gung - Restabelece Monica

Esta é uma excelente explicação. Eu acrescentaria apenas que o "valor verdadeiro" às vezes é um artefato do desenho do estudo. Ao pesquisar candidatos políticos, amostras estratificadas fornecem estimativas muito mais precisas e confiáveis do que uma amostra aleatória. O custo é um risco de superamostrar o grupo errado por design. Nesse caso, o IC95% centra-se no valor correto, aquele que é obtido pela replicação do estudo ad infinitum , mas esse valor não é o outro sentido de um parâmetro verdadeiro: o parâmetro que queríamos estimar. É por isso que o desenho e a inferência do estudo estão intrinsecamente vinculados.

— 11137 AdamO:

O que você está dizendo é que não há necessidade de encontrar intervalo de confiança a partir de reamostragens inicializadas. Se você estiver satisfeito com a estatística (média da amostra ou proporção da amostra) obtida a partir de reamostragens com bootstrap, não encontre nenhum intervalo de confiança e, portanto, nenhuma questão de interpretação. Mas se você não estiver satisfeito com a estatística obtida a partir de reamostragens inicializadas ou satisfeito, mas ainda desejar encontrar o intervalo de confiança, a interpretação para esse intervalo de confiança será a mesma que qualquer outro intervalo de confiança. Isso ocorre porque, quando as novas amostras de bootstrap representam exatamente (ou supõe-se que sejam) a população original, então onde está a necessidade de intervalo de confiança? A estatística das reamostragens inicializadas é o próprio parâmetro de população original, mas quando você não considera a estatística como o parâmetro de população original, é necessário encontrar o intervalo de confiança. Então, é tudo sobre como você considera. Digamos que você calculou um intervalo de confiança de 95% a partir de reamostragens inicializadas. Agora a interpretação é: "95% das vezes, esse método de inicialização resulta com precisão em um intervalo de confiança que contém o verdadeiro parâmetro populacional".

(Isto é o que eu penso. Corrija-me se houver algum erro).

— Chikatla Prashanth
fonte

-1

Estamos nos referindo ao verdadeiro parâmetro da população original. É possível fazer isso assumindo que os dados foram retirados aleatoriamente da população original - nesse caso, existem argumentos matemáticos que mostram que os procedimentos de autoinicialização fornecerão um intervalo de confiança válido, pelo menos quando o tamanho do conjunto de dados se tornar suficientemente grande .

— Gareth
fonte

Parece que, para entender por que funciona, preciso saber matemática suficiente para seguir as provas matemáticas. Isso está correto?

— Iarwain

Eu acho que sim (eu não estou familiarizado com as provas)

— Gareth

Intuitivamente, você pode ver que, à medida que o tamanho da amostra aumenta, a amostra começa a se parecer muito com a população. Por exemplo, digamos que eu colha 1 milhão de amostras de uma distribuição normal com média e variância especificadas. Chame essa amostra de X. Uma amostra aleatória (com substituição) extraída de X se parece muito com uma amostra aleatória retirada da distribuição original. Eu acho que essa é a idéia básica de por que funciona.

— Gareth