Você pode provar isso calculando explicitamente a densidade condicional por força bruta, como no link do procrastinador (+1) nos comentários. Mas há também um teorema que diz que todas as distribuições condicionais de uma distribuição normal multivariada são normais. Portanto, tudo o que resta é calcular o vetor médio e a matriz de covariância. Lembro que derivamos isso em uma classe de séries temporais na faculdade, definindo habilmente uma terceira variável e usando suas propriedades para derivar o resultado mais simplesmente do que a solução de força bruta no link (desde que você se sinta confortável com a álgebra matricial). Estou saindo da memória, mas era algo assim:
Seja a primeira partição e a segunda. Agora defina que . Agora podemos escreverx 2 z = x 1 + A x 2 A =- Σ 12 Σ - 1 22x1x2z=x1+Ax2A=−Σ12Σ−122
cov(z,x2)=cov(x1,x2)+cov(Ax2,x2)=Σ12+Avar(x2)=Σ12−Σ12Σ−122Σ22=0
Portanto, e não são correlacionados e, uma vez que são conjuntamente normais, são independentes . Agora, claramente , portanto, segue-se quex 2 E ( z ) = μ 1 + A μ 2zx2E(z)=μ1+Aμ2
E(x1|x2)=E(z−Ax2|x2)=E(z|x2)−E(Ax2|x2)=E(z)−Ax2=μ1+A(μ2−x2)=μ1+Σ12Σ−122(x2−μ2)
o que prova a primeira parte. Para a matriz de covariância, observe que
var(x1|x2)=var(z−Ax2|x2)=var(z|x2)+var(Ax2|x2)−Acov(z,−x2)−cov(z,−x2)A′=var(z|x2)=var(z)
Agora estamos quase terminando:
var(x1|x2)=var(z)=var(x1+Ax2)=var(x1)+Avar(x2)A′+Acov(x1,x2)+cov(x2,x1)A′=Σ11+Σ12Σ−122Σ22Σ−122Σ21−2Σ12Σ−122Σ21=Σ11+Σ12Σ−122Σ21−2Σ12Σ−122Σ21=Σ11−Σ12Σ−122Σ21
o que prova a segunda parte.
Nota: Para aqueles que não estão familiarizados com a álgebra matricial usada aqui, este é um excelente recurso .
Edit: Uma propriedade usada aqui, isso não está no livro de receitas da matriz (good catch @FlyingPig) é a propriedade 6 na página da Wikipedia sobre matrizes de covariância: que é aquela para dois vetores aleatórios , Para escalares, é claro, mas para vetores eles são diferentes na medida em que as matrizes estão dispostas de maneira diferente.v a r ( x + y ) = v a r ( x ) + v a r ( y ) + c o v ( x , y ) + c o v ( y , x ) c o v ( X , Y ) = c o v ( Y , X )x,y
var(x+y)=var(x)+var(y)+cov(x,y)+cov(y,x)
cov(X,Y)=cov(Y,X)