Eu estive analisando uma pergunta de aumento de dados do MCMC; a forma geral da pergunta é a seguinte:
Suponha que os dados coletados em um processo sugiram e um anterior para o parâmetro rate seja sugerido como . Os dados são registrados e apresentados de uma forma típica (ou seja, o número de ocorrências de cada valor para de a ), no entanto, os dados coletados não discriminam os casos em que (ou seja, todas as ocorrências em que e estão agrupadas em uma categoria).λ ~ Exp ( λ 0 ) X i 0 n X i ≤ 1 X i = 0 X i = 1
Dados os dados, a probabilidade e o descrito anteriormente, a pergunta pede:
A forma posterior de ,
O número de ocorrências em que .
Não tenho muita certeza de como responder a essa pergunta, mas sei que o Gibbs Sampling pode ser usado no aumento de dados. Alguém tem alguma informação sobre como isso pode ser feito?
EDITAR:
Devo especificar que é principalmente a segunda parte (o número de ocorrências em que ) sobre a qual não tenho certeza. Para a primeira parte (a forma posterior de ), dada a probabilidade e o sugerido anteriormente, eu raciocinei (embora eu esteja feliz por ser corrigido):λ
Dado:
Então, para o modelo dado acima:
Simplificando rendimentos:
que é proporcional a (e, portanto, a forma posterior é dada por):