Amostra grande assintótica / teoria - Por que se preocupar?


13

Espero que essa pergunta não seja marcada como "geral demais" e espero que comece uma discussão que beneficie a todos.

Nas estatísticas, gastamos muito tempo aprendendo grandes teorias de amostra. Estamos profundamente interessados ​​em avaliar as propriedades assintóticas de nossos estimadores, incluindo se são assintoticamente imparciais, assintoticamente eficientes, sua distribuição assintótica e assim por diante. A palavra assintótico está fortemente ligada à suposição de que .n

Na realidade, porém, sempre lidamos com finito . Minhas perguntas são:n

1) o que queremos dizer com amostra grande? Como podemos distinguir entre amostras pequenas e grandes?

2) Quando dizemos , queremos dizer literalmente que n deve ir para ?nn

ex para distribuição binomial, precisa de cerca de n = 30 para convergir para a distribuição normal no CLT. Deveríamos ter n ou neste caso por queremos dizer 30 ou mais ?!X¯n

3) Suponha que tenhamos uma amostra finita e suponha que sabemos tudo sobre o comportamento assintótico de nossos estimadores. E daí? suponha que nossos estimadores sejam assintoticamente imparciais, então temos uma estimativa imparcial para nosso parâmetro de interesse em nossa amostra finita ou significa que, se tivéssemos , teríamos uma imparcial?n

Como você pode ver nas perguntas acima, estou tentando entender a filosofia por trás de "grandes amostras assintóticas" e aprender por que nos importamos? Preciso ter algumas intuições para os teoremas que estou aprendendo.


5
O comportamento de amostras grandes é uma maneira de mostrar que um determinado estimador funciona, ou qualquer outra coisa, no limite de dados infinitos. Você está certo que isso não nos diz necessariamente nada sobre o quão bom é um estimador na prática, mas é um primeiro passo: é improvável que você queira usar um estimador que não seja assintoticamente consistente (ou o que seja). A vantagem da análise assintótica é que geralmente é mais fácil descobrir do que uma amostra finita.
Dougal

Você deve começar a ler sobre assintóticos de ordem superior, pois aparentemente você está familiarizado apenas com a normalidade assintótica de primeira ordem e tal; com isso, você ainda não sabe tudo sobre o comportamento assintótico. É como dizer: "Eu sei que ; por que todos dizem seno é periódica ???". sEunx=x
StasK,

1
n>30p=0,001n=30nmin(p,1-p)>15

Respostas:


6

Antes tarde do que nunca. Deixe-me primeiro listar três (acho importantes) razões pelas quais nos concentramos na imparcialidade assintótica (consistência) dos estimadores.

a) Consistência é um critério mínimo. Se um estimador não estima corretamente, mesmo com muitos dados, de que serve? Essa é a justificativa dada em Wooldridge: Econometria Introdutória.

b) As propriedades finitas da amostra são muito mais difíceis de provar (ou melhor, as declarações assintóticas são mais fáceis). Atualmente, estou pesquisando sozinho e, sempre que você pode confiar em ferramentas de amostra grandes, as coisas ficam muito mais fáceis. Leis de grandes números, teoremas de convergência de martingale etc. são boas ferramentas para obter resultados assintóticos, mas não ajudam com amostras finitas. Acredito que algo nesse sentido é mencionado em Hayashi (2000): Econometria.

c) Se os estimadores são tendenciosos para amostras pequenas, é possível potencialmente corrigir ou pelo menos melhorar com as chamadas correções de pequenas amostras. Geralmente, elas são complicadas teoricamente (para provar que elas melhoram no estimador sem a correção). Além disso, a maioria das pessoas não tem problema em contar com amostras grandes, portanto, pequenas correções de amostra geralmente não são implementadas no software estatístico padrão, porque apenas poucas pessoas precisam delas (aquelas que não conseguem obter mais dados E se preocupam com a imparcialidade). Portanto, existem certas barreiras ao uso dessas correções incomuns.

Em suas perguntas. O que queremos dizer com "amostra grande"? Isso depende muito do contexto e, para ferramentas específicas, pode ser respondido por simulação. Ou seja, você gera dados artificialmente e vê como, digamos, a taxa de rejeição se comporta em função do tamanho da amostra ou o viés se comporta em função do tamanho da amostra. Um exemplo específico está aqui , onde os autores veem quantos clusters são necessários para que os erros padrão do cluster OLS, bloqueiem os erros padrão inicializados etc. para ter um bom desempenho. Alguns teóricos também têm afirmações sobre a taxa de convergência, mas, para fins práticos, as simulações parecem ser mais informativas.

n

Na questão 3: geralmente, a questão da imparcialidade (para todos os tamanhos de amostra) e consistência (imparcialidade para amostras grandes) é considerada separadamente. Um estimador pode ser enviesado, mas consistente; nesse caso, de fato, apenas as grandes estimativas amostrais são imparciais. Mas também existem estimadores imparciais e consistentes, teoricamente aplicáveis ​​a qualquer tamanho de amostra. ( Um estimador também pode ser imparcial, mas inconsistente por razões técnicas. )

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.