A diferença simples entre os dois é que a distribuição posterior depende do parâmetro desconhecido , ou seja, a distribuição posterior é:
onde é a constante de normalização.θp ( θ | x ) = c × p ( x | θ ) p ( θ )
c
Enquanto, por outro lado, a distribuição preditiva posterior não depende do parâmetro desconhecido porque foi integrada, ou seja, a distribuição preditiva posterior é:
θp ( x∗| x ) = ∫Θc × p ( x∗, θ |x ) dθ = ∫Θc × p( x∗| θ)p(θ | x ) dθ
onde é uma nova variável aleatória não observada e é independente de .x∗x
Não vou me debruçar sobre a explicação da distribuição posterior, já que você diz que a entende, mas a distribuição posterior "é a distribuição de uma quantidade desconhecida, tratada como uma variável aleatória, condicionada às evidências obtidas" (Wikipedia). Basicamente, é a distribuição que explica seu parâmetro desconhecido e aleatório.
Por outro lado, a distribuição preditiva posterior tem um significado completamente diferente, pois é a distribuição para dados futuros previstos com base nos dados que você já viu. Portanto, a distribuição preditiva posterior é basicamente usada para prever novos valores de dados.
Se ajudar, é um gráfico de exemplo de uma distribuição posterior e uma distribuição preditiva posterior: