Como o objetivo aqui é presumivelmente obter alguma estimativa válida e útil de , a distribuição anterior deve ser consistente com a especificação da distribuição da população da qual a amostra vem. Isso NÃO significa que "calculamos" o anterior usando a própria amostra - isso anularia a validade de todo o procedimento. Sabemos que a população da qual a amostra provém é uma população de variáveis aleatórias uniformes de iid, cada uma variando em . Esta é uma suposição mantida e faz parte das informações anteriores que possuímos (e não tem nada a ver com a amostra , isto é, com uma realização específica de um subconjunto dessas variáveis aleatórias).θ[0,θ]
Agora suponha que essa população consista em variáveis aleatórias (enquanto nossa amostra consiste em realizações de variáveis aleatórias). A suposição mantida nos diz que
mn<mn
maxi=1,...,n{Xi}≤maxj=1,...,m{Xj}≤θ
Indique para compacidade . Então temos que também pode ser escrito
maxi=1,...,n{Xi}≡X∗θ≥X∗
θ=cX∗c≥1
A função densidade dos de iid Uniform rv variando em é
maxN[0,θ]
fX∗(x∗)=N(x∗)N−1θN
para o suporte e zero em outro lugar. Então, usando e aplicando a fórmula de mudança de variável, obtemos uma distribuição anterior para que é consistente com a suposição mantida:
[0,θ]θ=cX∗θ
fp(θ)=N(θc)N−1θN1c=NcNθ−1θ∈[x∗,∞]
o que pode ser impróprio se não especificarmos a constante adequadamente. Mas nosso interesse reside em ter um posterior apropriado para e também não queremos restringir os possíveis valores de (além da restrição implícita na suposição mantida). Então deixamos indeterminado.
Então, escrevendo a parte posterior écθθc
X={x1,..,xn}
f(θ∣X)∝θ−NNcNθ−1⇒f(θ∣X)=ANcNθ−(N+1)
para alguma constante de normalização A. Queremos
∫Sθf(θ∣X)dθ=1⇒∫∞x∗ANcNθ−(N+1)dθ=1
⇒ANcN1−Nθ−N∣∣∞x∗=1⇒A=(cx∗)N
Inserindo na parte posterior
f(θ∣X)=(cx∗)NNcNθ−(N+1)=N(x∗)Nθ−(N+1)
Observe que a constante indeterminada da distribuição anterior foi cancelada convenientemente.c
O posterior resume todas as informações que a amostra específica pode nos fornecer sobre o valor de . Se queremos obter um valor específico para , podemos calcular facilmente o valor esperado do posterior,
θθ
E(θ∣X)=∫∞x∗θN(x∗)Nθ−(N+1)dθ=−NN−1(x∗)Nθ−N+1∣∣∞x∗=NN−1x∗
Existe alguma intuição nesse resultado? Bem, à medida que o número de aumenta, o mais provável é que a realização máxima entre eles esteja cada vez mais próxima de seu limite superior, - que é exatamente o que o valor médio posterior de reflete: se, por exemplo, , , mas se . Isso mostra que nossa tática em relação à seleção do prior era razoável e consistente com o problema em questão, mas não necessariamente "ideal" em algum sentido.XθθN=2⇒E(θ∣X)=2x∗N=10⇒E(θ∣X)=109x∗