Suponho que você se sinta confortável em relação ao triângulo retângulo, o que significa que E[Y∣X] e Y−E[Y∣X] são variáveis aleatórias não correlacionadas . Para variáveis aleatórias não correlacionadas UMA e B ,
var( A + B ) = var( A ) + var( B ) ,(1)
e
, portanto, se definirmos
A = Y- E[ Y∣ X] e
B = E[ Y∣ X] modo que
A + B = Y , obtemos que
var(Y)=var(Y−E[Y∣X])+var(E[Y∣X]).(2)
Resta mostrar que
é o mesmo que
E [ var ( Y ∣ X ) ], para que possamos reestabelecer
( 2 ) como
var ( Y ) = E [ var ( Y ∣ X ) ] + var ( E [ Y ∣ X ] )
qual é a fórmula de variação total.
var(Y−E[Y∣X])E[var(Y∣X)](2)var(Y)=E[var(Y∣X)]+var(E[Y∣X])(3)
É bem conhecido que o valor esperado da variável aleatória é E [ Y ] , isto é, E [ E [ Y | X ] ] = E [ Y ] . Então vemos que
E [ A ] = E [ Y - E [ Y ∣ X ] ] = E [ Y ] - E [ E [E[Y∣X]E[Y]E[E[Y∣X]]=E[Y]
a partir do qual se segue que var ( A ) = E [ A 2 ] , isto é,
var ( Y - E [ Y | X ] ) = E [ ( Y - E [ Y | X ] ) 2 ] .
Seja C denotado a variável aleatória ( Y - E [ Y
E[A]=E[Y−E[Y∣X]]=E[Y]−E[E[Y∣X]]=0,
var(A)=E[A2]var(Y−E[Y∣X])=E[(Y−E[Y∣X])2].(4)
C para que possamos escrever essa
var ( Y - E [ Y ∣ X ] ) = E [ C ] .
Mas,
E [ C ] = E [ E [ C ∣ X ] ] onde
E [ C ∣ X ] = E [ ( Y - E [ Y ∣ X ] )(Y−E[Y∣X])2var(Y−E[Y∣X])=E[C].(5)
E[C]=E[E[C∣X]]
Agora,
dadoque
X = xE[C∣X]=E[(Y−E[Y∣X])2∣∣X].X=x , a distribuição condicional de
tem
E [ Y ∣ X = x ]
e então
E [ ( Y - E [ Y ∣ X = x ] ) 2 | X = x ] = var ( Y ∣ X = x ) .
Em outras palavras,
EYE[Y∣X=x]E[(Y−E[Y∣X=x])2∣∣X=x]=var(Y∣X=x).
modo que a
variável aleatória E [ C ∣ X ] seja apenas
var ( Y ∣ X ) . Portanto,
E [ C ] = E [ E [ C ∣ X ] ] = E [ var ( Y ∣ X ) ] ,E[C∣X=x]=var(Y∣X=x) E[C∣X]var(Y∣X)E[C]=E[E[C∣X]]=E[var(Y∣X)],(6)
(5)var(Y−E[Y∣X])=E[var(Y∣X)].
( 2 )( 3 )