Qual é a variação do máximo de uma amostra?


13

Eu estou procurando limites na variação do máximo de um conjunto de variáveis ​​aleatórias. Em outras palavras, estou procurando fórmulas de formulário fechado para B , de modo que

Var(maxiXi)B,
onde X={X1,,XM} seja um conjunto fixo de M variáveis ​​aleatórias com meios finitos μ1,,μM e variâncias σ12,,σM2 .

Posso deduzir esse

Var(maxiXi)iσi2,
mas esse limite parece muito frouxo. Um teste numérico parece indicar que B=maxiσi2 pode ser uma possibilidade, mas não consegui provar isso. Qualquer ajuda é apreciada.

3
(Você quer assumir que o é independente?) A conjectura é plausível, mas parece ser falsa. Por exemplo, faça algumas tentativas em que os estão com CDF , , . A variação do seu máximo, em relação à sua variação comum, aumenta sem limite à medida que cresce. X i 1 - x 1 - s 1 x s > 3 MXiXi1x1s1xs>3M
whuber

@whuber Obrigado, isso explica por que não fui capaz de provar essa conjectura :) De fato, estou interessado no caso em que os são independentes. Só para esclarecer, estou mais interessado em limites gerais que usam apenas os dois primeiros momentos. Não sei se existem limites gerais mais nítidos do que a variação comum. Xi
Peter Peter

1
Devo salientar que sua soma vinculada (supondo que esteja correta - seria bom ver um esboço da prova) é apertada. Por exemplo, permita que seja suportado no intervalo com variações que não excedam e permita que seja suportado em . Então como, com variação , mas a desigualdade pode ser reduzida tanto quanto você quiser diminuindo . [ - , a ] ε 2 X 1 [ a , ] max i X i = X 1 σ 2 1σ 2 1 + ( M - 1 ) ε 2 ε 2X2,,XM[,a]ε2X1[a,]maxiXi=X1σ12σ12+(M1)ε2ε2
whuber

1
Para dados iid, a teoria dos valores extremos fornece as classes de distribuições para as quais a amostra máxima converge, com certas condições nas caudas das distribuições originais, fornecendo classes diferentes das distribuições assintóticas. Portanto, duvido que você consiga derivar um bom vínculo com base apenas nos dois momentos, embora eu esteja apenas familiarizado tangencialmente com a teoria.
StasK

Respostas:


9

Para quaisquer variáveis ​​aleatórias , o melhor limite geral é conforme indicado na pergunta original. Aqui está um esboço de prova: Se X, Y são IID, então . Dado um vetor de variáveis ​​possivelmente dependentes , seja um vetor independente com a mesma distribuição conjunta. Para qualquer , vinculamos pela união queX i V um r ( máx X i ) Σ i V um r ( X i ) E [ ( X - Y ) 2 ] = 2 V um r ( X ) ( X 1 , ... , X N ) ( Y 1 , ... , Y n )nXiVar(maxXi)iVar(Xi)E[(XY)2]=2Var(X)(X1,,Xn)(Y1,,Yn)P [r>0P[|maxiXimaxiYi|2>r]iP[|XiYi|2>r] , e a integração deste de a produz a desigualdade reivindicada.dr0

Se são indicadores de eventos de probabilidade IID , então é um indicador de um evento de probabilidade . Fixando deixando tender a zero, obtemosXiϵmaxXinϵ+O(n2ϵ2)nϵVar(Xi)=ϵϵ2 e .Var(maxiXi)=nϵ+O(n2ϵ2)


3

Uma pergunta no MathOverflow está relacionada a essa pergunta.

Para variáveis ​​aleatórias IID, o k é o mais alto chamado estatística de ordem .

Mesmo para variáveis ​​aleatórias do IID Bernoulli, a variação de qualquer estatística de ordem que não seja a mediana pode ser maior que a variação da população. Por exemplo, se é com probabilidade e com probabilidade e , o máximo é com probabilidade , portanto, a variação da população é enquanto a variação do máximo é de cerca de .Xi11/1009/10M=10111/e0.090.23

Aqui estão dois documentos sobre as variações das estatísticas de pedidos:

Yang, H. (1982) "Sobre as variações da mediana e algumas outras estatísticas de ordem". Touro. Inst. Matemática. Acad. Sinica, 10 (2) pp. 197-204

Papadatos, N. (1995) "Variação máxima das estatísticas da ordem".Ann. Inst. Statist. Matemática, 47 (1) pp. 185-193

Acredito que o limite superior da variância do máximo no segundo artigo é . Eles apontam que a igualdade não pode ocorrer, mas qualquer valor mais baixo pode ocorrer para variáveis ​​aleatórias do IID Bernoulli.Mσ2

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.