WIP: trabalho em andamento
Seguindo p. 370 dos Métodos Matemáticos de Estatística de Cramer, em 1946 , definemAqui é a função de distribuição cumulativa da distribuição normal padrão, . Como conseqüência de sua definição, garantimos que quase certamente.Ξn=n(1−Φ(Zn)).
ΦN(0,1)0≤Ξn≤n
Considere uma realização dada do nosso espaço de amostra. Nesse sentido, é uma função de e e uma função de e . Para um fixo , podemos considerar uma função determinista do , e uma função determinista do e , simplificando assim o problema. Nosso objetivo é mostrar resultados que são válidos para quase todos osω∈ΩZnnωΞnZn,nωωZnnΞnZnnω∈Ω, permitindo transferir nossos resultados de uma análise não determinística para a configuração não determinística.
Seguindo p. 374 dos Métodos Matemáticos de Estatística de Cramer, de 1946 , pressupõem por enquanto (pretendo voltar e fornecer uma prova posteriormente) que somos capazes de mostrar que (para qualquer ) a seguinte expansão assintótica é válida integração por partes e a definição de ):ω∈ΩΦ
2π−−√nΞn=1Zne−Z2n2(1+O(1Z2n)) as Zn→∞.(~)
Claramente, temos que para qualquer e é quase certamente uma função crescente de como ; portanto, reivindicamos no que segue ao longo disso para (quase certamente todos) fixo :Zn+1≥ZnnZnnn→∞ωZn→∞⟺n→∞.
Portanto, temos que (onde denota equivalência assintótica ):∼
2π−−√nΞn∼1Zne−1Z2n as Zn→∞n→∞.
O modo como procedemos no que se segue equivale essencialmente ao método do equilíbrio dominante , e nossas manipulações serão formalmente justificadas pelo seguinte lema:
Lema: Assume-se que como , e (assim, ). Então, dada qualquer função que é formada por composições, adições e multiplicações de logaritmos e leis de potência (essencialmente qualquer função " polylog "), devemos ter também que como :Em outras palavras, essas funções "polilog" preservam a equivalência assintótica .f(n)∼g(n)n→∞f(n)→∞g(n)→∞hn→∞h(f(n))∼h(g(n)).
A verdade deste lema é uma consequência do Teorema 2.1. como está escrito aqui . Observe também que o que se segue é principalmente uma versão expandida (mais detalhes) da resposta a uma pergunta semelhante encontrada aqui .
Tomando logaritmos de ambos os lados, obtemos o seguinte:
log(2π−−√Ξn)−logn∼−logZn−Z2n2.(1)
É aqui que Cramer é um tanto cauteloso; ele apenas diz "assumindo que está limitado", podemos concluir blá blá blá. Mas mostrar que está adequadamente limitado quase certamente parece não ser nada trivial. Parece que a prova disso pode essencialmente fazer parte do que é discutido nas páginas 265-267 de Galambos, mas não tenho certeza, pois ainda estou trabalhando para entender o conteúdo desse livro.ΞnΞn
De qualquer forma, supondo que se possa mostrar quelogΞn=o(logn) , segue-se (uma vez que o domina o termo ) que:−Z2n/2−logZn
−logn∼−Z2n2⟹Zn∼2logn−−−−−√.
Isso é um pouco legal, já que já é a maior parte do que queremos mostrar, embora, novamente, valha a pena notar que ele está apenas chutando a lata pela estrada, pois agora temos que mostrar certa certeza de que . Por outro lado, tem a mesma distribuição para qualquer máximo de iid variáveis aleatórias contínuas, portanto, isso pode ser tratável.ΞnΞn
De qualquer forma, se como, então claramente também se pode concluir que para qualquer que é como . Usando nosso lema sobre funções polylog preservando a equivalência assintótica acima, podemos substituir essa expressão novamente em para obter:Zn∼2logn−−−−−√Zn∼2logn−−−−−√(1+α(n))α(n)o(1)n→∞(1)
log(2π−−√Ξn)−logn∼−log(1+α)−12log2−12loglogn−logn−2αlogn−α2logn.
⟹−log(Ξn2π−−√)∼log(1+α)+12log2+12loglogn+2αlogn+α2logn.
Aqui temos que ir ainda mais longe e assumir que quase certamentelogΞn=o(loglogn) as n→∞ . Novamente, tudo que Cramer diz é "assumindo que está limitado". Mas como tudo o que se pode dizer a priori sobre é que como, dificilmente parece claro que se deva ter quase certamente, o que parece ser a substância da afirmação de Cramer.ΞnΞn0≤Xin≤nΞn=O(1)
De qualquer forma, supondo que alguém acredite nisso, segue-se que o termo dominante que não contém é . Como , segue-se que e claramente , portanto, o termo dominante que contém é . Portanto, podemos reorganizar e (dividir tudo por ou ) descobrir queα12loglognα=o(1)α2=o(α)log(1+α)=o(α)=o(o(αlogn))α2αlogn12loglogn2αlogn
−12loglogn∼2αlogn⟹α∼−loglogn4logn.
Portanto, substituindo isso de volta ao descrito acima, obtemos o seguinte:
Zn∼2logn−−−−−√−loglogn22logn−−−−−√,
novamente, assumindo que acreditamos em certas coisas sobre .Ξn
Repetimos a mesma técnica novamente; desde , também segue-se queZn∼2logn−−−−−√−loglogn22logn√
Zn∼2logn−−−−−√−loglogn22logn−−−−−√(1+β(n))=2logn−−−−−√(1−loglogn8logn(1+β(n))),
quando . Vamos simplificar um pouco antes de substituir diretamente de volta para (1); nós entendemos isso:β(n)=o(1)
logZn∼log(2logn−−−−−√)+log(1−loglogn8logn(1+β(n)))log(O(1))=o(logn)∼log(2logn−−−−−√).
Z2n2∼logn−12loglogn(1+β)+(loglogn)28logn(1β)2o((1+β)loglogn)∼logn−12(1+β)loglogn.
Substituindo isso de volta em (1), descobrimos que:
log(2π−−√Ξn)−logn∼−log(2logn−−−−−√)−logn+12(1+β)loglogn⟹β∼log(4πΞ2n)loglogn.
Portanto, concluímos que quase certamente
Zn∼2logn−−−−−√−loglogn22logn−−−−−√(1+log(4π)+2log(Ξn)loglogn)=2logn−−−−−√−loglogn+log(4π)22logn−−−−−√−log(Ξn)2logn−−−−−√.
Isso corresponde ao resultado final na p.374 dos Métodos Matemáticos de Estatística de Cramer, de 1946, exceto que aqui a ordem exata do termo do erro não é dada. Aparentemente, a aplicação desse termo a mais dá a ordem exata do termo do erro, mas, de qualquer maneira, não parece necessário provar os resultados sobre os máximos das normais padrão iid nos quais estamos interessados.
Dado o resultado do exposto acima, a saber, quase que com certeza:
Zn∼2logn−−−−−√−loglogn+log(4π)22logn−−−−−√−log(Ξn)2logn−−−−−√⟹Zn=2logn−−−−−√−loglogn+log(4π)22logn−−−−−√−log(Ξn)2logn−−−−−√+o(1).(†)
2. Então, por linearidade da expectativa, segue-se que:
EZn=2logn−−−−−√−loglogn+log(4π)22logn−−−−−√−E[log(Ξn)]2logn−−−−−√+o(1)⟹EZn2logn−−−−−√=1−E[logΞn]2logn+o(1).
Portanto, mostramos que
limn→∞EZn2logn−−−−−√=1,
desde que também possamos mostrar que
E[logΞn]=o(logn).
Isso pode não ser muito difícil de mostrar, pois novamente tem a mesma distribuição para cada variável aleatória contínua. Assim, temos o segundo resultado de cima.Ξn
1. Da mesma forma, também temos do exposto que quase certamente:
Zn2logn−−−−−√=1−log(Ξn)2logn+o(1),.
Portanto, se podemos mostrar que:
log(Ξn)=o(logn) almost surely,(*)
então teremos mostrado o primeiro resultado de cima. O resultado (*) também implicaria claramente uma fortiori que , assim também nos deu o primeiro resultado acima.E[log(Ξn)]=o(logn)
Observe também que, na prova acima de ( ), precisamos assumir de qualquer maneira que quase com certeza (ou pelo menos algo semelhante), de modo que, se pudermos mostrar ( ), provavelmente também teremos no processo necessário para mostrar quase certamente, e, portanto, se pudermos provar , provavelmente conseguiremos chegar imediatamente a todas as conclusões a seguir.†Ξn=o(logn)†Ξn=o(logn)(†)
3. No entanto, se tivermos esse resultado, não entendo como alguém também teria esse , já que . Mas, no mínimo, parece verdade queEZn=2logn−−−−−√+Θ(1)o(1)≠Θ(1)EZn=2logn−−−−−√+O(1).
Portanto, parece que podemos nos concentrar em responder à pergunta de como mostrar queΞn=o(logn) almost surely.
Também precisaremos fazer o trabalho duro de fornecer uma prova para (~), mas, até onde sei, isso é apenas cálculo e não envolve teoria de probabilidades, embora eu ainda precise sentar e tentar ainda.
Primeiro, vamos passar por uma cadeia de trivialidades para reformular o problema de uma maneira que facilite a solução (observe que, por definição, ):Ξn≥0
Ξn=o(logn)⟺limn→∞Ξnlogn=0⟺∀ε>0,Ξnlogn>ε only finitely many times⟺∀ε>0,Ξn>εlogn only finitely many times.
Também se tem que:
Ξn>εlogn⟺n(1−F(Zn))>εlogn⟺1−F(Zn)>εlognn⟺F(Zn)<1−εlognn⟺Zn≤inf{y:F(y)≥1−εlognn}.
De forma correspondente, defina para todos os :n
u(ε)n=inf{y:F(y)≥1−εlognn}.
Portanto, as etapas acima nos mostram que:
Ξn=o(logn) a.s.⟺P(Ξn=o(logn))=1⟺P(∀ε>0,Ξn>εlogn only finitely many times)=1⟺P(∀ε>0,Zn≤u(ε)n only finitely many times)=1⟺P(∀ε>0,Zn≤u(ε)n infinitely often)=0.
Observe que podemos escrever:
{∀ε>0,Zn≤u(ε)n infinitely often}=⋂ε>0{Zn≤u(ε)n infinitely often}.
As seqüências uniformemente à medida que diminui, para que possamos concluir que os eventos estão diminuindo (ou pelo menos de alguma forma monotônica) como vai para . Portanto, o axioma da probabilidade em relação às seqüências monotônicas de eventos nos permite concluir que:u(ε)nε{Zn≤u(ε)n infinitely often}
ε0
P(∀ε>0,Zn≤u(ε)n infinitely often)=P(⋂ε>0{Zn≤u(ε)n infinitely often})=P(limε↓0{Zn≤u(ε)n infinitely often})=limε↓0P(Zn≤u(ε)n infinitely often).
Portanto, basta mostrar que, para todos os ,ε>0
P(Zn≤u(ε)n infinitely often)=0
porque é claro que o limite de qualquer sequência constante é a constante.
Aqui está um resultado de marreta:
Teorema 4.3.1., P. 252 de Galambos, A teoria assintótica das estatísticas de ordem extrema , 2ª edição. Sejam suas variáveis com a função de distribuição contínua e não-regenerada e comum , e seja uma sequência não decrescente, de modo que também não diminua. Em seguida, para ,
acordo com
X1,X2,…F(x)unn(1−F(un))un<sup{x:F(x)<1}P(Zn≤un infinitely often)=0 or 1
∑j=1+∞[1−F(uj)]exp(−j[1−F(uj)])<+∞ or =+∞.
A prova é técnica e leva cerca de cinco páginas, mas acaba sendo um corolário de um dos lemas de Borel-Cantelli. Eu posso tentar condensar a prova para usar apenas a parte necessária para esta análise, bem como apenas as suposições contidas no caso gaussiano, que podem ser mais curtas (mas talvez não seja) e digitá-la aqui, mas prender a respiração não é recomendado. Observe que, nesse caso, , de modo que a condição é vazia, e é portanto, claramente não decrescente.ω(F)=+∞n(1−F(n))εlogn
De qualquer forma, o ponto é que, apelando para esse teorema, se podemos mostrar que:
∑j=1+∞[1−F(u(ε)j)]exp(−j[1−F(u(ε)j)])=∑j=1+∞[εlogjj]exp(−εlogj)=ε∑j=1+∞logjj1+ε<+∞.
Observe que, como o crescimento logarítmico é mais lento do que qualquer crescimento da lei de energia para qualquer expoente positivo da lei de energia (logaritmos e exponenciais preservam a monotonicidade, portanto, e a antiga desigualdade sempre podem ser vistas como válidas para todos os grandes o suficiente devido ao fato de e uma alteração de variáveis), temos o seguinte:loglogn≤αlogn⟺logn≤nαnlogn≤n
∑j=1+∞logjj1+ε≤∑j=1+∞jε/2j1+ε=∑j=1+∞1j1+ε/2<+∞,
uma vez que a série p é conhecida por convergir para todos os , e obviamente implica .p>1ε>01+ε/2>1
Assim, usando o teorema acima, mostramos que, para todos os , , o que recapitular deve significar que quase certamente.ε>0P(Zn≤u(ε)n i.o.)=0Ξn=o(logn)
Ainda precisamos mostrar que . Isso não segue o exposto acima, pois, por exemplo,logΞn=o(loglogn)
1nlogn=o(logn),−logn+loglogn≠o(logn).
No entanto, dada uma sequência , se é possível mostrar que para arbitrário , segue-se que . Idealmente, eu gostaria de poder mostrar isso para usando o lema acima (supondo que seja verdade), mas não posso (até o momento).xnxn=o((logn)δ)δ>0log(xn)=o(loglogn)Ξn