Estou trabalhando na derivação de um posterior Normal-Wishart, mas estou preso em um dos parâmetros (o posterior da matriz de escala, veja na parte inferior).
Apenas por contexto e integridade, aqui está o modelo e o restante das derivações:
xiμΛ∼N(μ,Λ)∼N(μ0,(κ0Λ)−1)∼W(υ0,W0)
As formas expandidas de cada um dos três fatores é (até uma constante de proporcionalidade) são:
Probabilidade:
N(xi|μ,Λ)∝|Λ|N/2exp(−12∑i=1N(xTiΛxi−2μTΛxi+μTΛμ))
Normal anterior:
N(μ|(μ0,κ0Λ)−1)∝|Λ|1/2exp(−12(μTκ0Λμ−2μTκ0Λμ0+μT0κ0Λμ0))
Wishart anterior:
W(Λ|υ0,W0)∝|Λ|υ0−D−12exp(−12tr(W−10Λ))
Queremos o Normal-Wishart posterior ( ) que pode ser decomposto como bem como :μ,Λ|μ′,κ′,υ′,W′N(μ|μ,κ′Λ)W(Λ|υ′,W′)
Degress of freedomυ′
Ao mesclar os primeiros fatores da probabilidade e o Wishart, obtemos o primeiro fator do fator Wishart no posterior:
e, portanto, temos o primeiro parâmetro do posterior:
|Λ|υ0+N−D−12
υ′=υ0+N
Fator de escalaκ′
Identificamos os elementos cercados por e para descobrir quem o é atualizado pela probabilidade:
e, portanto, obtemos o segundo parâmetro:
μTμκ0Λ
μT((κ0+N)Λ)μ
κ′=κ0+N
Significaμ′
O terceiro parâmetro vem da identificação do que está dentro de :
E, portanto, obtivemos o terceiro parâmetro:
2μT...
2μT(ΛNx¯¯¯+κ0Λμ0)(ΛNx¯¯¯+κ0Λμ0)(Nx¯¯¯+κ0μ0)=2μTκ′Λμ′=κ′Λμ′=κ′μ′
μ′=1k′(Nx¯¯¯+κ0μ0)
Matriz de escalaW′
E o quarto parâmetro vem do trabalho nos parâmetros restantes:
tr(W′−1Λ)=tr(W−10Λ)+∑i=1NxTiΛxi+μT0κ0Λμ0=tr(W−10Λ)+∑i=1Ntr(xTiΛxi)+tr(μT0κ0Λμ0)=tr(W−10Λ+∑i=1NxTiΛxi+μT0κ0Λμ0)
Como prosseguir a partir daqui (se não cometi erros até agora) e obter a solução padrão para ?W′
Editar 1 :
Agora reorganizamos os termos, adicionamos e subtraímos alguns fatores para obter dois quadrados, como na solução padrão:
tr(W′−1Λ)==tr(W−1Λ+∑i=1N(xTiΛxi+x¯¯¯TΛx¯¯¯−2xTiΛx¯¯¯)+κ0(μT0Λμ0+x¯¯¯TΛx¯¯¯−2x¯¯¯TΛμ0)−∑i=1Nx¯¯¯TΛx¯¯¯+2∑i=1NxTiΛx¯¯¯−κ0x¯¯¯TΛx¯¯¯+2κ0x¯¯¯TΛμ0)tr(W−1Λ+∑i=1N(xi−x¯¯¯)Λ(xi−x¯¯¯)T+κ0(x¯¯¯−μ0)Λ(x¯¯¯−μ0)T−Nx¯¯¯Λx¯¯¯T+2Nx¯¯¯Λx¯¯¯T−κ0x¯¯¯Λx¯¯¯T+2κ0x¯¯¯ΛμT0)
Simplificamos os fatores que permanecem fora dos quadrados:
tr(W′−1Λ)=tr(W−1Λ+∑i=1N(xi−x¯¯¯)TΛ(xi−x¯¯¯)+κ0(x¯¯¯−μ0)TΛ(x¯¯¯−μ0)+(N−κ0)x¯¯¯TΛx¯¯¯+2κ0x¯¯¯TΛμ0)
Edição 2 ( acompanhamento graças à resposta de @bdeonovic )
O traço é cíclico, então . Então:
e depois:
tr(ABC)=tr(BCA)=tr(CAB)
tr(W′−1Λ)=tr(W−1Λ+∑i=1N(xi−x¯¯¯)(xi−x¯¯¯)TΛ+κ0(x¯¯¯−μ0)(x¯¯¯−μ0)TΛ+(N−κ0)x¯¯¯x¯¯¯TΛ+2κ0x¯¯¯μT0Λ)
tr(W′−1)=tr(W−1+∑i=1N(xi−x¯¯¯)(xi−x¯¯¯)T+κ0(x¯¯¯−μ0)(x¯¯¯−μ0)T+(N−κ0)x¯¯¯x¯¯¯T+2κ0x¯¯¯μT0)
Quase! Mas ainda não está lá. O objetivo é:
W−1+∑i=1N(xi−x¯¯¯)(xi−x¯¯¯)T+κ0Nκ0+N(x¯¯¯−μ0)(x¯¯¯−μ0)T