A análise pode ser um pouco confusa, principalmente se realizada com rigor total e elementar, mas a ideia é simples e fácil de entender. Concentre-se em pequenas regiões muito próximas de e . À medida que e aproximam de , quase toda a probabilidade de uma distribuição Beta fica localizada nessas regiões. Ao reduzir os tamanhos das regiões, vemos que a distribuição limitadora, se existir, pode ser apenas uma distribuição de Bernoulli. Podemos criar uma distribuição limitadora apenas tornando a abordagem ratio uma constante, exatamente como descrito na pergunta.01αβ0(α,β)α:β
O bom dessa análise é que olhar para áreas relativas evita qualquer necessidade de considerar o comportamento da constante de normalização, uma função Beta . Esta é uma simplificação considerável. (Evitar a função Beta é semelhante em espírito à minha análise dos quantis de distribuição Beta em Dois quantis de uma distribuição beta determinam seus parâmetros? )B(α,β)
Um outro recurso dessa análise é aproximar a função Beta incompleta por integrais simples da forma para constantes . Isso reduz tudo às operações mais elementares de cálculo e desigualdades algébricas.∫tcd tc > - 1
O PDF beta é proporcional aConsidere small e examine as contribuições para a área sob dentro dos três intervalos , e como e cresce pequeno (mas permanece positivo).
f( x ) =xα - 1( 1 - x)β- 1.
ε > 0f( 0 , ϵ )( ϵ , 1 - ϵ )[ 1 - ϵ , 1 )αβ
Eventualmente, e serão menores que : , portanto, terão pólos em e , assim:αβ1f01
O gráfico de é a linha azul superior. Comparados a ele, estão os gráficos de (curva vermelha, com um polo apenas em ) e (curva de ouro, com um polo apenas em ) .fxα−10(1−x)β−11
O que acontece com as três áreas sob , relativas uma à outra, no limite?f
Por uma questão de notação, escreva para a área sob o gráfico de entre e . Estou perguntando sobre os tamanhos relativos de , e .
F(x)=∫x0f(t)dt=∫x0tα−1(1−t)β−1dt
f0xF(ϵ)F(1−ϵ)−F(ϵ)F(1)−F(1−ϵ)
Vamos estimar essas áreas uma de cada vez, assumindo sempre e e . Sob essas suposições0<α<10<β<1, 0<x<1,0<ϵ<1/2
xα−1>1;(1−x)β−1>1,
x→xα−1 (vermelho) é uma função decrescente em e (dourado) é uma função crescente. x,x→(1−x)β−1
À esquerda, parece que as curvas azul e vermelha se aproximam. De fato, para , as desigualdades anteriores rendem os limitesA integração de cada um entre e é simples e pressiona entre dois limites próximos,0<x<ϵ
xα−1<xα−1(1−x)β−1<xα−1(1−ϵ)β−1.
0ϵF(ϵ)ϵαα<F(ϵ)<(1−ϵ)β−1ϵαα.(1)
A mesma análise se aplica ao lado direito, produzindo um resultado semelhante.
Como é côncavo, no intervalo do meio ele atinge seus valores extremos nos pontos finais. Consequentemente, a área é menor que a do trapézio medido por esses pontos:f[ϵ,1−ϵ]
F(1−ϵ)−F(ϵ)<12(f(ϵ)+f(1−ϵ))(1−ϵ−ϵ)=1−2ϵ2(ϵα−1(1−ϵ)β−1+(1−ϵ)α−1ϵβ−1)).(2)
Embora isso ameace ficar confuso, vamos corrigir temporariamente e considerar o que acontece com a razão como e aproximam-se de . Nas expressões e , ambos e abordarão . Assim, os únicos termos que importam no limite sãoϵ(F(1−ϵ)−F(ϵ)):F(ϵ)αβ0(1)(2)(1−ϵ)α−1(1−ϵ)β−1(1−ϵ)0=1
F(1−ϵ)−F(ϵ)F(ϵ)≈(ϵα−1+ϵβ−1)/2ϵα/α=α2ϵ+α2ϵα−β≈αϵ(3)
porque . Consequentemente, desde , eventualmente a área do meio é inconseqüente em comparação com a área da esquerda.α−β≈0α→0
O mesmo argumento mostra que, eventualmente, a área do meio está próxima de vezes a área correta, o que também se torna irrelevante. Isto mostra queβ/ϵ
(∗) Não importa o que pode ser, se tomarmos tanto e de ser suficientemente pequeno, então essencialmente toda a área sob está concentrada dentro do intervalo esquerdo e o intervalo certo .0<ϵ<1/2 αβf(0,ϵ)(1−ϵ,1)
O resto é fácil: a média estará muito próxima da área próxima ao polo direito (prova: subestime-a substituindo por nas integrais nos intervalos esquerdo e médio e por no intervalo certo, em seguida, superestime-o substituindo por à esquerda, no meio em Ambas as expressões aproximam-se de .) Mas, por as áreas relativas são aproximadamentexf(x)0f(x)(1−ϵ)f(x)xf(x)ϵf(x)(1−ϵ)f(x)f(x)F(1)−F(1−ϵ)(3),
F(1)−F(1−ϵ)F(ϵ)≈ϵ/βϵ/α=αβ.
Mantendo a média constante, essa relação permanece constante, permitindo adicionar mais uma observação a :(∗)
(∗∗) Se deixarmos e de tal maneira que aproxime de uma constante limitadora , eventualmente a proporção da área à direita da área na esquerda ficará arbitrariamente perto de também.α→0β→0α/βλλ
Agora contemple encolhendo para zero. O resultado é que a distribuição limitadora existe e deve ter toda a sua probabilidade concentrada em torno dos valores e : esta é a classe das distribuições de Bernoulli. indica qual: como a distribuição de Bernoulli , cuja média é atribui a probabilidade a e a probabilidade a , a razão deve ser a razão limitanteϵ01(∗∗)(p)p,p11−p0p/(1−p)λ.
Na terminologia da pergunta,
λ=α/(1−μμα)=μ1−μ=p1−p,
como reivindicado.