Eu estava revisando a documentação do Stan, que pode ser baixada aqui . Eu estava particularmente interessado na implementação do diagnóstico Gelman-Rubin. O artigo original Gelman & Rubin (1992) define o potencial fator de redução de escala (PSRF) da seguinte maneira:
Deixe que ser o th cadeia de Markov amostrado, e que não haja geral cadeias independentes amostrados. Deixe ser a média do th da cadeia, e ser o global significativo. Definir,
Definir V = ( N - 1 O PSRF é estimado com √
A documentação Stan na página 349 ignora o prazo com e também remove o ( M + 1 ) / H multiplicativo prazo. Essa é a fórmula deles,
O estimador de variância é Finalmente, a estatística de redução de escala potencial é definido por R = √
Pelo que pude ver, eles não fornecem uma referência para essa mudança de fórmula e nem discutem isso. Geralmente não é muito grande e geralmente pode ser tão baixo quanto 2 , portanto ( M + 1 ) / M não deve ser ignorado, mesmo que o termo d f possa ser aproximado com 1.
Então, de onde vem essa fórmula?
Edição: Encontrei uma resposta parcial para a pergunta "de onde vem essa fórmula? ", Em que o livro Bayesian Data Analysis de Gelman, Carlin, Stern e Rubin (Segunda edição) tem exatamente a mesma fórmula. No entanto, o livro não explica como / por que é justificável ignorar esses termos?