A pergunta faz duas coisas: (1) como mostrar que o máximo de converge, no sentido de que ( X ( n ) - b n ) / a n converge (em distribuição) para seqüências adequadamente escolhidas ( a n ) e ( b n ) , à distribuição Standard Gumbel e (2) como encontrar tais seqüências.X(n)(X(n)−bn)/an(an)(bn)
O primeiro é bem conhecido e documentado nos trabalhos originais sobre o teorema de Fisher-Tippett-Gnedenko (FTG). O segundo parece ser mais difícil; esse é o problema abordado aqui.
Observe, para esclarecer algumas afirmações que aparecem em outras partes deste tópico, que
O máximo não converge para nada: diverge (ainda que extremamente devagar).
Parece haver diferentes convenções sobre a distribuição Gumbel. Adotarei a convenção de que o CDF de uma distribuição reversa de Gumbel é, de acordo com a escala e a localização, dado por . Um máximo padronizado de variáveis normais normais converge para uma distribuição Gumbel invertida.1−exp(−exp(x))
Intuição
Quando o são iid com função de distribuição comum F , a distribuição do máximo X ( n ) éXiFX(n)
Fn(x)=Pr(X(n)≤x)=Pr(X1≤x)Pr(X2≤x)⋯Pr(Xn≤x)=Fn(x).
Quando o suporte de não tem limite superior, como na distribuição Normal, a sequência de funções F n marcha para sempre para a direita, sem limite:FFn
Gráficos parciais de para n = 1 , 2 , 2 2 , 2 4 , 2 8 , 2 16 são mostrados.Fnn=1,2,22,24,28,216
Para estudar as formas dessas distribuições, podemos mudar cada um de volta para a esquerda por uma certa quantidade e redimensionar-lo por um n para torná-los comparáveis.bnan
Cada um dos gráficos anteriores foi deslocado para colocar sua mediana em e fazer seu intervalo interquartil de comprimento unitário.0
O FTG afirma que as seqüências e ( b n ) podem ser escolhidas para que essas funções de distribuição converjam ponto a ponto a cada x para uma distribuição de valor extremo , até a escala e a localização. Quando F é uma distribuição Normal, a distribuição de valor extremo limitante específica é um Gumbel invertido, até o local e a escala.(an)(bn)xF
Solução
Fnanbn
0<q<1FnqxqFn(xq)=qFn(x)=Fn(x)
xq;n=F−1(q1/n).
Portanto, podemos definir
bn=x1/2;n, an=x3/4;n−x1/4;n; Gn(x)=Fn(anx+bn).
Gn01Gn01βαα+βloglog(2)β(loglog(4)−loglog(4/3))
α=loglog2loglog(4/3)−loglog(4); β=1loglog(4)−loglog(4/3).
anbnGnF
a′n=log((4log2(2))/(log2(43)))22log(n)−−−−−−√, b ′n= 2 log( N )------√- log( log( n ) ) + log( 4 πregistro2( 2 ) )2 2 log( N )------√
funcionará bem (e é o mais simples possível).
Gnn = 2 , 26, 211, 216uma′nb′nαβx
Referências
BV Gnedenko, sobre a distribuição limitante do prazo máximo em uma série aleatória . Em Kotz e Johnson, Breakthroughs in Statistics Volume I: Foundations and Basic Theory, Springer, 1992. Traduzido por Norman Johnson.