Qual é o resultado mais poderoso do máximo de gaussianos? O mais usado na prática?


9

Dado iid, considere as variáveis ​​aleatóriasX1,,Xn,N(0,1)

Zn:=max1inXi.

Pergunta: Qual é o resultado mais "importante" sobre essas variáveis ​​aleatórias?

Para esclarecer a "importância", qual resultado tem mais outros resultados como conseqüência lógica? Qual dos resultados é usado com mais frequência na prática?

Mais especificamente, parece haver conhecimento folclórico entre estatísticos (teóricos) de que o Zn é "basicamente o mesmo que" 2logn , pelo menos assintoticamente. (Veja esta pergunta relacionada .)

No entanto, existem muitos resultados relacionados a esse tipo, e parece ser o caso que a maioria não é equivalente nem implica um ao outro. Por exemplo ,

(1)Zn2logna.s.1,

que, se nada mais, também implica os resultados correspondentes em probabilidade e distribuição.

No entanto, nem sequer implica resultados aparentemente relacionados (veja essa outra pergunta ), como

(2)limnEZn2logn=1,

(este é o exercício 2.17 da página 49 da ) ou outro resultado do folclore :

(3)EZn=2logn+Θ(1).

Não assintoticamente, também se sabe que para cada (veja aqui uma prova),n

(4)clognEZn2logn

para alguns pequenos . Resultados semelhantes também podem ser mostrados para, já que é altamente inclinado à direita.c|Zn|Zn

A prova deste último resultado é muito mais direta do que as provas dos outros resultados. Minha esperança era que o primeiro resultado assintótico tivesse implicado todos os outros assintóticos, para que eu pudesse me sentir confiante, concentrando todo meu tempo e energia na compreensão desse resultado. Mas, novamente, isso aparentemente não é verdade , então agora não está claro para mim o que devo focar.

Ver pp. 265-267 da segunda edição de Galambos, The The Asymptotic Theory of Extreme Order Statistics , impressa em 1987. Provavelmente também está em algum lugar da primeira edição.

Boucheron, Lugosi, Massart, Desigualdades de Concentração: Uma Teoria Não Independente da Independência . Além: Este livro realmente cita Galambos para o resultado em questão, mas não consigo encontrá-lo mencionado em nenhum lugar de Galambos - apenas o primeiro resultado que mencionei.


11
Você sabia que, quando você usa \ dots no MathJax, o resultado às vezes aparece como se você tivesse usado \ ldots e às vezes como se tivesse usado \ cdots, dependendo do contexto? Troquei \ dots por \ ldots nesta pergunta.
X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)
Michael Hardy

@ MichaelHardy Oh, eu pensei que era sempre centrado. Obrigado pela correção!
precisa saber é o seguinte

Respostas:


4

Em qualquer aplicação probabilística, o objeto mais fundamental é a distribuição, com os momentos e as propriedades limitantes sendo derivados disso. Portanto, o resultado mais "importante", no sentido que você descreveu, é a função de distribuição completa (equivalentemente, a função de densidade correspondente). Na prática, esse resultado distributivo é talvez menos esclarecedor do que algumas das propriedades assintóticas mais básicas que você já listou. Embora isso implique logicamente esses resultados assintóticos, na minha opinião, é provável que esses resultados sejam mais esclarecedores na compreensão da natureza mutável do valor extremo à medida que mudamos .FZn(z)=Φn(z)n

Está claro em sua pergunta que você tem um bom entendimento das propriedades de valor extremo no caso de um máximo de variáveis ​​aleatórias normais padrão do IID. Essas propriedades são todas derivadas logicamente da função de distribuição para , portanto esse é o objeto mais fundamental em funcionamento nesse problema. Como em muitos casos, o objeto mais fundamental não é necessariamente o mais esclarecedor e, portanto, você provavelmente descobrirá que precisa se contentar em conhecer todos os resultados e sabendo que eles iluminam diferentes aspectos do problema.Zn


Obrigado por esta resposta - agradeço. Você conhece uma referência sobre como derivar todas essas propriedades da função de distribuição para ? Tenho tido extrema dificuldade em encontrar algo que explique isso, porque é tudo "folclore" ou "de mãos dadas". Zn
Chill2Macht

Para o registro, eu li os links e eles não ajudam. Por isso fiz a pergunta.
Chill2Macht

11
Não tenho uma referência específica a recomendar, mas acho que esses resultados seriam derivados de livros sobre teoria de valores extremos. Eu sugiro que você comece procurando alguns textos de pós-graduação sobre esse assunto e veja se consegue encontrar as derivações lá.
Ben - Restabelece Monica

1

WIP: trabalho em andamento

Seguindo p. 370 dos Métodos Matemáticos de Estatística de Cramer, em 1946 , definemAqui é a função de distribuição cumulativa da distribuição normal padrão, . Como conseqüência de sua definição, garantimos que quase certamente.

Ξn=n(1Φ(Zn)).
ΦN(0,1)0Ξnn

Considere uma realização dada do nosso espaço de amostra. Nesse sentido, é uma função de e e uma função de e . Para um fixo , podemos considerar uma função determinista do , e uma função determinista do e , simplificando assim o problema. Nosso objetivo é mostrar resultados que são válidos para quase todos osωΩZnnωΞnZn,nωωZnnΞnZnnωΩ, permitindo transferir nossos resultados de uma análise não determinística para a configuração não determinística.

Seguindo p. 374 dos Métodos Matemáticos de Estatística de Cramer, de 1946 , pressupõem por enquanto (pretendo voltar e fornecer uma prova posteriormente) que somos capazes de mostrar que (para qualquer ) a seguinte expansão assintótica é válida integração por partes e a definição de ):ωΩΦ

(~)2πnΞn=1ZneZn22(1+O(1Zn2))  as  Zn.

Claramente, temos que para qualquer e é quase certamente uma função crescente de como ; portanto, reivindicamos no que segue ao longo disso para (quase certamente todos) fixo :Zn+1ZnnZnnnω

Znn.

Portanto, temos que (onde denota equivalência assintótica ):

2πnΞn1Zne1Zn2  as  Znn.

O modo como procedemos no que se segue equivale essencialmente ao método do equilíbrio dominante , e nossas manipulações serão formalmente justificadas pelo seguinte lema:

Lema: Assume-se que como , e (assim, ). Então, dada qualquer função que é formada por composições, adições e multiplicações de logaritmos e leis de potência (essencialmente qualquer função " polylog "), devemos ter também que como :Em outras palavras, essas funções "polilog" preservam a equivalência assintótica .f(n)g(n)nf(n)g(n)hn

h(f(n))h(g(n)).

A verdade deste lema é uma consequência do Teorema 2.1. como está escrito aqui . Observe também que o que se segue é principalmente uma versão expandida (mais detalhes) da resposta a uma pergunta semelhante encontrada aqui .

Tomando logaritmos de ambos os lados, obtemos o seguinte:

(1)log(2πΞn)lognlogZnZn22.

É aqui que Cramer é um tanto cauteloso; ele apenas diz "assumindo que está limitado", podemos concluir blá blá blá. Mas mostrar que está adequadamente limitado quase certamente parece não ser nada trivial. Parece que a prova disso pode essencialmente fazer parte do que é discutido nas páginas 265-267 de Galambos, mas não tenho certeza, pois ainda estou trabalhando para entender o conteúdo desse livro.ΞnΞn

De qualquer forma, supondo que se possa mostrar quelogΞn=o(logn) , segue-se (uma vez que o domina o termo ) que:Zn2/2logZn

lognZn22Zn2logn.

Isso é um pouco legal, já que já é a maior parte do que queremos mostrar, embora, novamente, valha a pena notar que ele está apenas chutando a lata pela estrada, pois agora temos que mostrar certa certeza de que . Por outro lado, tem a mesma distribuição para qualquer máximo de iid variáveis ​​aleatórias contínuas, portanto, isso pode ser tratável.ΞnΞn

De qualquer forma, se como, então claramente também se pode concluir que para qualquer que é como . Usando nosso lema sobre funções polylog preservando a equivalência assintótica acima, podemos substituir essa expressão novamente em para obter:Zn2lognZn2logn(1+α(n))α(n)o(1)n(1)

log(2πΞn)lognlog(1+α)12log212loglognlogn2αlognα2logn.

log(Ξn2π)log(1+α)+12log2+12loglogn+2αlogn+α2logn.

Aqui temos que ir ainda mais longe e assumir que quase certamentelogΞn=o(loglogn)  as  n . Novamente, tudo que Cramer diz é "assumindo que está limitado". Mas como tudo o que se pode dizer a priori sobre é que como, dificilmente parece claro que se deva ter quase certamente, o que parece ser a substância da afirmação de Cramer.ΞnΞn0XinnΞn=O(1)

De qualquer forma, supondo que alguém acredite nisso, segue-se que o termo dominante que não contém é . Como , segue-se que e claramente , portanto, o termo dominante que contém é . Portanto, podemos reorganizar e (dividir tudo por ou ) descobrir queα12loglognα=o(1)α2=o(α)log(1+α)=o(α)=o(o(αlogn))α2αlogn12loglogn2αlogn

12loglogn2αlognαloglogn4logn.

Portanto, substituindo isso de volta ao descrito acima, obtemos o seguinte:

Zn2lognloglogn22logn,

novamente, assumindo que acreditamos em certas coisas sobre .Ξn

Repetimos a mesma técnica novamente; desde , também segue-se queZn2lognloglogn22logn

Zn2lognloglogn22logn(1+β(n))=2logn(1loglogn8logn(1+β(n))),

quando . Vamos simplificar um pouco antes de substituir diretamente de volta para (1); nós entendemos isso:β(n)=o(1)

logZnlog(2logn)+log(1loglogn8logn(1+β(n)))log(O(1))=o(logn)log(2logn).

Zn22logn12loglogn(1+β)+(loglogn)28logn(1β)2o((1+β)loglogn)logn12(1+β)loglogn.

Substituindo isso de volta em (1), descobrimos que:

log(2πΞn)lognlog(2logn)logn+12(1+β)loglognβlog(4πΞn2)loglogn.

Portanto, concluímos que quase certamente

Zn2lognloglogn22logn(1+log(4π)+2log(Ξn)loglogn)=2lognloglogn+log(4π)22lognlog(Ξn)2logn.

Isso corresponde ao resultado final na p.374 dos Métodos Matemáticos de Estatística de Cramer, de 1946, exceto que aqui a ordem exata do termo do erro não é dada. Aparentemente, a aplicação desse termo a mais dá a ordem exata do termo do erro, mas, de qualquer maneira, não parece necessário provar os resultados sobre os máximos das normais padrão iid nos quais estamos interessados.


Dado o resultado do exposto acima, a saber, quase que com certeza:

()Zn2lognloglogn+log(4π)22lognlog(Ξn)2lognZn=2lognloglogn+log(4π)22lognlog(Ξn)2logn+o(1).

2. Então, por linearidade da expectativa, segue-se que:

EZn=2lognloglogn+log(4π)22lognE[log(Ξn)]2logn+o(1)EZn2logn=1E[logΞn]2logn+o(1).

Portanto, mostramos que

limnEZn2logn=1,

desde que também possamos mostrar que

E[logΞn]=o(logn).

Isso pode não ser muito difícil de mostrar, pois novamente tem a mesma distribuição para cada variável aleatória contínua. Assim, temos o segundo resultado de cima.Ξn

1. Da mesma forma, também temos do exposto que quase certamente:

Zn2logn=1log(Ξn)2logn+o(1),.

Portanto, se podemos mostrar que:

(*)log(Ξn)=o(logn) almost surely,

então teremos mostrado o primeiro resultado de cima. O resultado (*) também implicaria claramente uma fortiori que , assim também nos deu o primeiro resultado acima.E[log(Ξn)]=o(logn)

Observe também que, na prova acima de ( ), precisamos assumir de qualquer maneira que quase com certeza (ou pelo menos algo semelhante), de modo que, se pudermos mostrar ( ), provavelmente também teremos no processo necessário para mostrar quase certamente, e, portanto, se pudermos provar , provavelmente conseguiremos chegar imediatamente a todas as conclusões a seguir.Ξn=o(logn)Ξn=o(logn)()

3. No entanto, se tivermos esse resultado, não entendo como alguém também teria esse , já que . Mas, no mínimo, parece verdade queEZn=2logn+Θ(1)o(1)Θ(1)

EZn=2logn+O(1).


Portanto, parece que podemos nos concentrar em responder à pergunta de como mostrar que

Ξn=o(logn) almost surely.

Também precisaremos fazer o trabalho duro de fornecer uma prova para (~), mas, até onde sei, isso é apenas cálculo e não envolve teoria de probabilidades, embora eu ainda precise sentar e tentar ainda.

Primeiro, vamos passar por uma cadeia de trivialidades para reformular o problema de uma maneira que facilite a solução (observe que, por definição, ):Ξn0

Ξn=o(logn)limnΞnlogn=0ε>0,Ξnlogn>ε only finitely many timesε>0,Ξn>εlogn only finitely many times.

Também se tem que:

Ξn>εlognn(1F(Zn))>εlogn1F(Zn)>εlognnF(Zn)<1εlognnZninf{y:F(y)1εlognn}.

De forma correspondente, defina para todos os :n

un(ε)=inf{y:F(y)1εlognn}.

Portanto, as etapas acima nos mostram que:

Ξn=o(logn) a.s.P(Ξn=o(logn))=1P(ε>0,Ξn>εlogn only finitely many times)=1P(ε>0,Znun(ε) only finitely many times)=1P(ε>0,Znun(ε) infinitely often)=0.

Observe que podemos escrever:

{ε>0,Znun(ε) infinitely often}=ε>0{Znun(ε) infinitely often}.

As seqüências uniformemente à medida que diminui, para que possamos concluir que os eventos estão diminuindo (ou pelo menos de alguma forma monotônica) como vai para . Portanto, o axioma da probabilidade em relação às seqüências monotônicas de eventos nos permite concluir que:un(ε)ε

{Znun(ε) infinitely often}
ε0

P(ε>0,Znun(ε) infinitely often)=P(ε>0{Znun(ε) infinitely often})=P(limε0{Znun(ε) infinitely often})=limε0P(Znun(ε) infinitely often).

Portanto, basta mostrar que, para todos os ,ε>0

P(Znun(ε) infinitely often)=0

porque é claro que o limite de qualquer sequência constante é a constante.

Aqui está um resultado de marreta:

Teorema 4.3.1., P. 252 de Galambos, A teoria assintótica das estatísticas de ordem extrema , 2ª edição. Sejam suas variáveis ​​com a função de distribuição contínua e não-regenerada e comum , e seja uma sequência não decrescente, de modo que também não diminua. Em seguida, para , acordo com X1,X2,F(x)unn(1F(un))un<sup{x:F(x)<1}

P(Znun infinitely often)=0 or 1
j=1+[1F(uj)]exp(j[1F(uj)])<+ or =+.

A prova é técnica e leva cerca de cinco páginas, mas acaba sendo um corolário de um dos lemas de Borel-Cantelli. Eu posso tentar condensar a prova para usar apenas a parte necessária para esta análise, bem como apenas as suposições contidas no caso gaussiano, que podem ser mais curtas (mas talvez não seja) e digitá-la aqui, mas prender a respiração não é recomendado. Observe que, nesse caso, , de modo que a condição é vazia, e é portanto, claramente não decrescente.ω(F)=+n(1F(n))εlogn

De qualquer forma, o ponto é que, apelando para esse teorema, se podemos mostrar que:

j=1+[1F(uj(ε))]exp(j[1F(uj(ε))])=j=1+[εlogjj]exp(εlogj)=εj=1+logjj1+ε<+.

Observe que, como o crescimento logarítmico é mais lento do que qualquer crescimento da lei de energia para qualquer expoente positivo da lei de energia (logaritmos e exponenciais preservam a monotonicidade, portanto, e a antiga desigualdade sempre podem ser vistas como válidas para todos os grandes o suficiente devido ao fato de e uma alteração de variáveis), temos o seguinte:loglognαlognlognnαnlognn

j=1+logjj1+εj=1+jε/2j1+ε=j=1+1j1+ε/2<+,

uma vez que a série p é conhecida por convergir para todos os , e obviamente implica .p>1ε>01+ε/2>1

Assim, usando o teorema acima, mostramos que, para todos os , , o que recapitular deve significar que quase certamente.ε>0P(Znun(ε) i.o.)=0Ξn=o(logn)

Ainda precisamos mostrar que . Isso não segue o exposto acima, pois, por exemplo,logΞn=o(loglogn)

1nlogn=o(logn),logn+loglogno(logn).

No entanto, dada uma sequência , se é possível mostrar que para arbitrário , segue-se que . Idealmente, eu gostaria de poder mostrar isso para usando o lema acima (supondo que seja verdade), mas não posso (até o momento).xnxn=o((logn)δ)δ>0log(xn)=o(loglogn)Ξn

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.