Será mais uma pergunta para @ Xi'an do que uma resposta.
V( θ | y) = α1 1β1 1( α1 1+ β1 1)2( α1 1+ β1 1+ 1 )= ( α0 0+ k ) ( n - k + β0 0)( α0 0+ n + β0 0)2( α0 0+ n + β0 0+ 1 ),
nkα0 0, β0 0V( θ ) = α0 0β0 0( α0 0+ β0 0)2( α0 0+ β0 0+ 1 )
n <- 10
k <- 1
alpha0 <- 100
beta0 <- 20
theta <- seq(0.01,0.99,by=0.005)
likelihood <- theta^k*(1-theta)^(n-k)
prior <- function(theta,alpha0,beta0) return(dbeta(theta,alpha0,beta0))
posterior <- dbeta(theta,alpha0+k,beta0+n-k)
plot(theta,likelihood,type="l",ylab="density",col="lightblue",lwd=2)
likelihood_scaled <- dbeta(theta,k+1,n-k+1)
plot(theta,likelihood_scaled,type="l",ylim=c(0,max(c(likelihood_scaled,posterior,prior(theta,alpha0,beta0)))),ylab="density",col="lightblue",lwd=2)
lines(theta,prior(theta,alpha0,beta0),lty=2,col="gold",lwd=2)
lines(theta,posterior,lty=3,col="darkgreen",lwd=2)
legend("top",c("Likelihood","Prior","Posterior"),lty=c(1,2,3),lwd=2,col=c("lightblue","gold","darkgreen"))
> (postvariance <- (alpha0+k)*(n-k+beta0)/((alpha0+n+beta0)^2*(alpha0+n+beta0+1)))
[1] 0.001323005
> (priorvariance <- (alpha0*beta0)/((alpha0+beta0)^2*(alpha0+beta0+1)))
[1] 0.001147842
Portanto, este exemplo sugere uma maior variação posterior no modelo binomial.
Obviamente, essa não é a variação posterior esperada. É aí que reside a discrepância?
A figura correspondente é