Com as distribuições em nossos vetores aleatórios:
xi|μ∼N(μ,Σ)
μ∼N(μ0,Σ0)
Pela regra de Bayes, a distribuição posterior se parece com:
p(μ|{xi})∝p(μ)∏Ni=1p(xi|μ)
Então:
lnp(μ|{xi})=−12∑Ni=1(xi−μ)′Σ−1(xi−μ)−12(μ−μ0)′Σ−10(μ−μ0)+const
=−12Nμ′Σ−1μ+∑Ni=1μ′Σ−1xi−12μ′Σ−10μ+μ′Σ−10μ0+const
=−12μ′(NΣ−1+Σ−10)μ+μ′(Σ−10μ0+Σ−1∑Ni=1xi)+const
=−12(μ−(NΣ−1+Σ−10)−1(Σ−10μ0+Σ−1∑Ni=1xi))′(NΣ−1+Σ−10)(μ−(NΣ−1+Σ−10)−1(Σ−10μ0+Σ−1∑Ni=1xi))+const
Qual é a densidade de log de um gaussiano:
μ|{xi}∼N((NΣ−1+Σ−10)−1(Σ−10μ0+Σ−1∑Ni=1xi),(NΣ−1+Σ−10)−1)
Usando a identidade Woodbury em nossa expressão para a matriz de covariância:
(NΣ−1+Σ−10)−1=Σ(1NΣ+Σ0)−11NΣ0
O que fornece a matriz de covariância na forma que o OP queria. Usando esta expressão (e sua simetria) ainda mais na expressão para a média, temos:
Σ(1NΣ+Σ0)−11NΣ0Σ−10μ0+1NΣ0(1NΣ+Σ0)−1ΣΣ−1∑Ni=1xi
=Σ(1NΣ+Σ0)−11Nμ0+Σ0(1NΣ+Σ0)−1∑Ni=1(1Nxi)
Qual é a forma exigida pelo OP para a média.