Sim, podemos obter um resultado análogo usando a média e variância da amostra, com, talvez, algumas pequenas surpresas surgindo no processo.
Primeiro, precisamos refinar um pouco a declaração da pergunta e definir algumas suposições. Importante, deve ficar claro que não podemos esperar substituir a variação populacional pela variação da amostra no lado direito, pois o último é aleatório ! Portanto, reorientamos nossa atenção para a desigualdade equivalente
Caso não esteja claro se são equivalentes, observe que simplesmente substituímos por na desigualdade original sem qualquer perda de generalidade.t t σ
P(X−EX≥tσ)≤11+t2.
ttσ
Segundo, assumimos que temos uma amostra aleatória e estamos interessados em um limite superior para a quantidade análoga
, onde é a amostra média e é o desvio padrão da amostra.P ( X 1 - ˉ X ≥ t S ) ˉ X SX1,…,XnP(X1−X¯≥tS)X¯S
Meio passo à frente
Observe que já aplicando a desigualdade original de Chebyshev unilateral a , obtemos que
que , que é menor que o lado direito da versão original. Isso faz sentido! Qualquer realização específica de uma variável aleatória de uma amostra tenderá a ser (ligeiramente) mais próxima da média da amostra para a qual ela contribui do que da média da população. Como veremos abaixo, substituiremos por sob premissas ainda mais gerais. P ( X 1 - ˉ X ≥ t σ ) ≤ 1X1−X¯σ2=Var(X1)σS
P(X1−X¯≥tσ)≤11+nn−1t2
σ2=Var(X1)σS
Uma versão de exemplo do Chebyshev unilateral
Reivindicação : Seja uma amostra aleatória tal que . Em seguida,Em particular, a versão de amostra do limite é mais estreita que a versão da população original.P ( S = 0 ) = 0 P ( X 1 - ˉ X ≥ t S ) ≤ 1X1,…,XnP(S=0)=0
P(X1−X¯≥tS)≤11+nn−1t2.
Nota : Nós não assumir que o quer ter finito média ou variância!Xi
Prova . A idéia é adaptar a prova da desigualdade original de Chebyshev, unilateral, e empregar simetria no processo. Primeiro, defina para conveniência notacional. Em seguida, observe que
P ( Y 1 ≥ t S ) = 1Yi=Xi−X¯
P(Y1≥tS)=1n∑i=1nP(Yi≥tS)=E1n∑i=1n1(Yi≥tS).
Agora, para qualquer , em ,
{ S > 0 } 1 ( Y i ≥ t S ) = 1 ( Y i + t c S ≥ t S ( 1 + c ) ) ≤ 1 ( ( Y i + t c S ) 2 ≥ t 2 ( 1 + c ) 2 S 2 ) ≤ ( Yc>0{S>0}
1(Yi≥tS)=1(Yi+tcS≥tS(1+c))≤1((Yi+tcS)2≥t2(1+c)2S2)≤(Yi+tcS)2t2(1+c)2S2.
Então,
uma vez que e .ˉ Y = 0 Σ i Y 2 i = ( n - 1 ) S 2
1n∑i1(Yi≥tS)≤1n∑i(Yi+tcS)2t2(1+c)2S2=(n−1)S2+nt2c2S2nt2(1+c)2S2=(n−1)+nt2c2nt2(1+c)2,
Y¯=0∑iY2i=(n−1)S2
O lado direito é uma constante ( ! ), Portanto, assumir as expectativas de ambos os lados gera,
Finalmente, minimizando sobre , produz , que após um pouco de álgebra estabelece o resultado.
P(X1−X¯≥tS)≤(n−1)+nt2c2nt2(1+c)2.
cc=n−1nt2
Essa condição técnica traquina
Observe que tivemos que assumir para poder dividir por na análise. Isso não é problema para distribuições absolutamente contínuas, mas representa um inconveniente para distribuições discretas. Para uma distribuição discreta, há alguma probabilidade de que todas as observações são iguais, caso em que para todos os e .P(S=0)=0S20=Yi=tS=0it>0
Podemos nos desviar definindo . Então, um cuidadoso relato do argumento mostra que tudo passa praticamente inalterado e temosq=P(S=0)
Corolário 1 . Para o caso , temosq=P(S=0)>0
P(X1−X¯≥tS)≤(1−q)11+nn−1t2+q.
Prova . Divida nos eventos e . A prova anterior passa por e o caso é trivial.{S>0}{S=0}{S>0}{S=0}
Uma desigualdade ligeiramente mais limpa resulta se substituirmos a desigualdade não estrita na declaração de probabilidade por uma versão estrita.
Corolário 2 . Seja (possivelmente zero). Então,q=P(S=0)
P(X1−X¯>tS)≤(1−q)11+nn−1t2.
Observação final : a versão amostral da desigualdade não exigiu suposições sobre (exceto que ela não é quase certamente constante no caso de desigualdade não estrita, que a versão original também assume tacitamente), em essência, porque a média da amostra e a variação da amostra sempre existe, independentemente de seus análogos populacionais existirem.X