É bem sabido (ou facilmente comprovado) que o quadrático tem um extremo em z = - βαz2+2βz+γ . Isso mostra que, para quaisquernnúmeros reaisx1,x2,…,xn, a quantidade
G(a)= n ∑ i=1(xi-a)2=( n ∑ i = 1 x 2 i )-2a( n ∑ i = 1 xi)+nz=−βαnx1,x2,…,xn
tem valor mínimo quando
a = 1
G(a)=∑i=1n(xi−a)2=(∑i=1nx2i)−2a(∑i=1nxi)+na2,
.
a=1n∑i=1nxi=x¯
Agora, suponha que o são uma amostra de tamanho n de uma distribuição com média desconhecida μ e variância desconhecida σ 2 . Podemos estimar μ como 1xinμσ2μ que é fácil de calcular, mas uma tentativa de estimarσ2
como11n∑ni=1xi=x¯σ2encontra o problema que não conhecemosμ. É claro que podemos calcular prontamente
G( ˉ x )e sabemos queG(μ)≥G( ˉ x ), mas quanto maior éG(μ)? A resposta é que
G(μ)1n∑ni=1(xi−μ)2=n−1G(μ)μG(x¯)G(μ)≥G(x¯)G(μ)G(μ)é maior que por um fator de aproximadamente nG(x¯) , ou seja,
G ( μ ) ≈ nnn−1e, portanto, aestimativan-1G(μ)=1
G(μ)≈nn−1G(x¯)(1)
para a variação da distribuição pode ser aproximada por
1n−1G(μ)=1n∑i=1n(xi−μ)21n−1G(x¯)=1n−1∑i=1n(xi−x¯)2.
Então, qual é a explicação intuitiva de ? Bem, nós temos esse
G ( μ )(1)
desdeΣ n i = 1 (xi- ˉ x )=n ˉ x -n ˉ x =0. Agora,
n ( ˉ x - μ ) 2
G(μ)=∑i=1n(xi−μ)2=∑i=1n(xi−x¯+x¯−μ)2=∑i=1n((xi−x¯)2+(x¯−μ)2+2(xi−x¯)(x¯−μ))=G(x¯)+n(x¯−μ)2+(x¯−μ)∑i=1n(xi−x¯)=G(x¯)+n(x¯−μ)2(2)
∑ni=1(xi−x¯)=nx¯−nx¯=0
Exceto quando temos uma amostra extraordinariamente incomum na qual todos os
xisão maiores que
μ(ou são todos menores que
μ), as somas
(xi-μ)(xj-μ)na soma dupla no lado direito de
(3)n(x¯−μ)2=n1n2(∑i=1n(xi−μ))2=1n∑i=1n(xi−μ)2+2n∑i=1n∑j=i+1n(xi−μ)(xj−μ)=1nG(μ)+2n∑i=1n∑j=i+1n(xi−μ)(xj−μ)(3)
xiμμ(xi−μ)(xj−μ)(3)assumir valores positivos e negativos e, portanto, muitos cancelamentos ocorrem. Assim, pode-se esperar que a soma dupla tenha
pequeno valor absoluto, e nós simplesmente a ignoramos em comparação com a
Termo
G(μ)no lado direito de
(3). Assim,
(2)
torna-se
G(μ)≈G( ˉ x )+11nG(μ)(3)(2)
tal como reivindicado em
(1).
G(μ)≈G(x¯)+1nG(μ)⟹G(μ)≈nn−1G(x¯)
(1)