Existem exemplos de onde o teorema do limite central não se sustenta?

32

A Wikipedia diz -

Na teoria da probabilidade, o teorema do limite central (CLT) estabelece que, na maioria das situações , quando variáveis aleatórias independentes são adicionadas, sua soma adequadamente normalizada tende a uma distribuição normal (informalmente uma "curva de sino"), mesmo que as próprias variáveis originais não sejam distribuído normalmente...

Quando diz "na maioria das situações", em quais situações o teorema do limite central não funciona?

— Ryan McCauley
fonte

33

Para entender isso, você precisa primeiro declarar uma versão do Teorema do Limite Central. Aqui está a declaração "típica" do teorema do limite central:

Lindeberg – Lévy CLT. Suponha que seja uma sequência de variáveis aleatórias iid com e . Deixe . Então, quando aproxima do infinito, as variáveis aleatórias convergem na distribuição para um normal isto é, ${X_1, X_2, \dots}$ $E[X_i] = \mu$ $Var[X_i] = \sigma^2 < \infty$ $S_{n}:={\frac {X_{1}+\cdots +X_{n}}{n}}$ $n$ $\sqrt{n}(S_n − \mu)$ $N(0,\sigma^2)$

$\sqrt{n} ((\frac{1}{n} \sum_{i = 1}^{n} X_{i}) - μ) \overset{d}{\to} N (0, σ^{2}) .$ ${\displaystyle {\sqrt {n}}\left(\left({\frac {1}{n}}\sum _{i=1}^{n}X_{i}\right)-\mu \right)\ {\xrightarrow {d}}\ N\left(0,\sigma ^{2}\right).}$

Então, como isso difere da descrição informal e quais são as lacunas? Existem várias diferenças entre sua descrição informal e essa descrição, algumas das quais foram discutidas em outras respostas, mas não completamente. Portanto, podemos transformar isso em três perguntas específicas:

O que acontece se as variáveis não forem identicamente distribuídas?
E se as variáveis tiverem variação infinita ou média infinita?
Quão importante é a independência?

Tomando estes de cada vez,

Não distribuídos de forma idêntica . Os melhores resultados gerais são as versões de Lindeberg e Lyaponov do teorema do limite central. Basicamente, desde que os desvios padrão não cresçam muito, você pode obter um teorema do limite central decente.

Lyapunov CLT. [5] Suponha que seja uma sequência de variáveis aleatórias independentes, cada uma com valor esperado finito e variação Defina: ${X_1, X_2, \dots}$ $\mu_i$ $\sigma^2$ $s_{n}^{2}=\sum _{i=1}^{n}\sigma _{i}^{2}$

Se, para alguns , a condição de Lyapunov está satisfeito, então uma soma de converge na distribuição para uma variável aleatória normal padrão, como n vai para o infinito: $\delta > 0$ $\lim _{n\to \infty }{\frac {1}{s_{n}^{2+\delta }}}\sum_{i=1}^{n}\operatorname {E} \left[|X_{i}-\mu _{i}|^{2+\delta }\right]=0$ $X_i − \mu_i / s_n$

${{\frac {1}{s_{n}}}\sum _{i=1}^{n}\left(X_{i}-\mu_{i}\right)\ {\xrightarrow {d}}\ N(0,1).}$

Variação infinita Teoremas semelhantes ao teorema do limite central existem para variáveis com variação infinita, mas as condições são significativamente mais estreitas do que para o teorema do limite central usual. Essencialmente, a cauda da distribuição de probabilidade deve ser assintótica para para . Nesse caso, summands dimensionados apropriados convergem para uma distribuição estável Levy-Alpha . $|x|^{-\alpha-1}$ $0 < \alpha < 2$

Importância da independência Existem muitos teoremas de limite central diferentes para seqüências não independentes de . Todos eles são altamente contextuais. Como Batman aponta, há um para Martingales. Esta questão é uma área de pesquisa em andamento, com muitas, diferentes variações, dependendo do contexto específico de interesse. Esta pergunta sobre troca de matemática é outro post relacionado a essa pergunta. $X_i$

— John
fonte

2

Eu removi um ">" perdido de uma fórmula que eu acho que entrou por causa do sistema de citações - sinta-se à vontade para reverter minha edição, se for intencional!

— Silverfish

Um CLT de matriz triangular é provavelmente um CLT mais representativo do que o indicado. Por não serem independentes, os CLT da martingale são casos razoavelmente usados.

— Batman

@ Batman, o que é um exemplo de uma matriz triangular CLT? Sinta-se livre para editar minha resposta e adicioná-la. Eu não estou familiarizado com isso.

— John

Algo como seg. 4.2.3 em personal.psu.edu/drh20/asymp/lectures/p93to100.pdf

— Batman

1

"contanto que os desvios padrão não cresçam muito" Ou encolher (por exemplo:

σ_{i}^{2} = σ_{i - 1}^{2} / 2

$\sigma_i^2 = \sigma_{i-1}^2/2$

— 2/2

21

Embora eu tenha certeza de que já foi respondido antes, aqui está outro:

Existem várias versões do teorema do limite central, sendo a mais geral dada a função de densidade de probabilidade arbitrária, a soma das variáveis será distribuída normalmente com um valor médio igual à soma dos valores médios, e a variação sendo a soma das variações individuais.

Uma restrição muito importante e relevante é que a média e a variação dos pdfs fornecidos devem existir e devem ser finitas.

Portanto, basta pegar qualquer pdf sem valor médio ou variação - e o teorema do limite central não será mais válido. Então, pegue uma distribuição lorentziana, por exemplo.

— querubim
fonte

+1 Ou faça uma distribuição com uma variação infinita, como a distribuição de uma caminhada aleatória.

— Alexis

2

@Alexis - supondo que você está olhando para um passeio aleatório em um ponto finito no tempo, eu teria pensado que teria uma variação finita, sendo a soma de passos iid cada um com variância finita

n

$n$

— Henry

1

@ Henry: Não, não estou assumindo em um ponto no tempo, mas a variação da distribuição de todos os possíveis passeios aleatórios de comprimentos infinitos.

— Alexis

1

@Alexis Se cada passo da caminhada aleatória for ou iid com probabilidade igual e as posições forem , o Teorema do Limite Central implica corretamente que, como você tem a distribuição de convergindo na distribuição para

X_{i}

$X_i$

+ 1

$+1$

- 1

$-1$

Y_{n} = \sum_{1}^{n} X_{i}

$Y_n =\sum_1^n X_i$

n \to \infty

$n \to \infty$

\sqrt{n} (\frac{1}{n} Y_{n}) = \frac{Y_{n}}{\sqrt{n}}

$\sqrt{n}\left(\frac1n Y_n\right) = \frac{Y_n}{\sqrt{n}}$

N (0, 1)

$\mathcal N(0,1)$

— Henry

1

@ Alexis Não importa para o CLT, porque cada distribuição individual ainda tem uma variação finita.

— Cubic

15

Não, a CLT sempre se mantém quando suas premissas se mantêm. Qualificações como "na maioria das situações" são referências informais às condições sob as quais a CLT deve ser aplicada.

Por exemplo, uma combinação linear de variáveis independentes da distribuição Cauchy não adicionará a variável distribuída Normal . Uma das razões é que a variação não é definida para a distribuição de Cauchy , enquanto o CLT impõe certas condições à variação, por exemplo, que deve ser finito. Uma implicação interessante é que, como as simulações de Monte Carlo são motivadas pelo CLT, você deve ter cuidado com as simulações de Monte Carlo ao lidar com distribuições de cauda gorda, como Cauchy.

Observe que há uma versão generalizada do CLT. Funciona para variações infinitas ou indefinidas, como a distribuição de Cauchy. Ao contrário de muitas distribuições bem comportadas, a soma normalizada dos números de Cauchy permanece Cauchy. Não converge para gaussiano.

A propósito, não apenas as gaussianas, mas muitas outras distribuições possuem PDFs em forma de sino, por exemplo, Student t. É por isso que a descrição que você citou é bastante liberal e imprecisa, talvez de propósito.

— Aksakal
fonte

7

Aqui está uma ilustração da resposta do querubim, um histograma de 1e5 é extraído de meios de amostra em escala (por ) de distribuições t com dois graus de liberdade, de modo que a variação não exista . $\sqrt{n}$

Se a CLT se aplicou, o histograma para tão grande quanto deve se parecer com a densidade de uma distribuição normal padrão (que, por exemplo, tem densidade no seu pico), o que evidentemente não. $n$ $n=1000$ $1/\sqrt{2\pi}\approx0.4$

library(MASS)
n <- 1000
samples.from.t <- replicate(1e5, sqrt(n)*mean(rt(n, df = 2)))
truehist(samples.from.t, xlim = c(-10,10), col="salmon")

— Christoph Hanck
fonte

3

Você deve ter um pouco de cuidado aqui, como se você fizesse isso com uma distribuição com, digamos, graus de liberdade, o teorema do limite central se aplicaria, mas seu gráfico não teria uma densidade de pico em torno de mas em torno de porque a variação original não seria

t

$t$

3

$3$

0.4

$0.4$

\frac{1}{\sqrt{6 π}} \approx 0.23

$\frac1{\sqrt{6\pi}}\approx 0.23$

1

$1$

— Henry

Esse é um bom ponto, pode-se padronizar a média sd(x)para obter algo que, se o CLT funcionar, converge pelo teorema de Slutzky, para uma variável N (0,1). Eu queria manter o exemplo simples, mas é claro que você está certo.

— Christoph Hanck

6

Um caso simples em que o CLT não pode ser mantido por razões muito práticas é quando a sequência de variáveis aleatórias se aproxima do limite de probabilidade estritamente de um lado . Isso é encontrado, por exemplo, em estimadores que estimam algo que se encontra em um limite.

O exemplo padrão aqui talvez seja a estimativa de em uma amostra de iid Uniforms . O estimador de máxima verossimilhança será a estatística de ordem máxima e se aproximará necessariamente apenas a partir de baixo: pensando ingenuamente, uma vez que seu limite de probabilidade será , o estimador não pode ter uma distribuição "ao redor" - e o CLT é se foi. $\theta$ $U(0,\theta)$ $\theta$ $\theta$ $\theta$

O estimador adequadamente dimensionado tem uma distribuição limitadora - mas não da "variedade CLT".

— Alecos Papadopoulos
fonte

3

Você pode encontrar uma solução rápida aqui.

Surgem exceções ao teorema do limite central

Quando houver vários máximos da mesma altura e
Onde a segunda derivada desaparece no máximo.

Existem outras exceções descritas na resposta do @cherub.

A mesma pergunta já foi feita em math.stackexchange . Você pode verificar as respostas lá.

— Ferdi
fonte

5

Por "maxima", você quer dizer modos? Ser bimodal não tem nada a ver com não satisfazer a CLT.

— Acumulação

@ Acumulação: A redação aqui é confusa porque na verdade se refere ao PGF de um rv discreto

M (z) = \sum_{n = - \infty}^{\infty} P (X = n) z^{n}

$M(z)=\sum_{n=-\infty}^\infty P(X=n)z^n$

— Alex R.

@AlexR. A resposta não faz sentido sem ler o link e está longe de ser clara, mesmo com o link. Estou inclinado a reduzir a votação como sendo ainda pior do que uma resposta apenas de link.

— Acumulação