Igual ou diferente? O caminho bayesiano


10

Digamos que tenho o seguinte modelo:

Poisson(λ){λ1if t<τλ2if tτ

E deduzo os posteriores para e mostrados abaixo a partir dos meus dados. Existe uma maneira bayesiana de dizer (ou quantificar) se e são iguais ou diferentes ?λ 2 λ 1 λ 2λ1λ2λ1λ2

Talvez medindo a probabilidade de que seja diferente deλ 2λ1λ2 ? Ou talvez usando divergências KL?

Por exemplo, como posso medir ou pelo menos ?p ( λ 2 > λ 1 )p(λ2λ1)p(λ2>λ1)

Em geral, depois que você mostra os posteriores abaixo (assuma valores PDF diferentes de zero em qualquer lugar para ambos), qual é uma boa maneira de responder a essa pergunta?

insira a descrição da imagem aqui

Atualizar

Parece que esta pergunta pode ser respondida de duas maneiras:

  1. Se tivermos amostras das posteriores, poderemos examinar a fração das amostras em que (ou equivalente ). O @ Cam.Davidson.Pilon incluiu uma resposta que resolveria esse problema usando essas amostras.λ 2 > λ 1λ1λ2λ2>λ1

  2. Integrando algum tipo de diferença dos posteriores. E essa é uma parte importante da minha pergunta. Como seria essa integração? Presumivelmente, a abordagem de amostragem aproximaria essa integral, mas eu gostaria de saber a formulação dessa integral.

Nota: Os gráficos acima são provenientes deste material .


Você pode apenas calcular a variação de ambas as distribuições e adicioná-las. Essa é a variação da diferença nos meios. Em seguida, calcule a diferença nas médias e veja quantos desvios padrão são. Você pode aproximar ambas as distribuições com normal para iniciar e usar os intervalos de confiança habituais para uma distribuição normal. São meios claramente diferentes.
Dave31415


3
Todos os cálculos necessários são fornecidos em meu trabalho , mas eu não ter estudado o caso de ( é a relação entre as duas taxas de Poisson)ϕH0:{ϕ=1}ϕ
Stéphane Laurent

Obrigado @ StéphaneLaurent. Seu artigo é um excelente indicador, mas parece ser específico dos processos de Poisson. Qual é a comparação, em alto nível, que um bayesiano pode fazer para estimar se é igual ou diferente de ? A análise precisa ser específica da distribuição? λ2λ1
Amelio Vazquez-Reina

2
Desculpe @ user023472 Não tenho energia atualmente. Veja os artigos de Bernardo citados no meu artigo. "Intrínseco" significa que o método é derivado e somente do modelo.
Stéphane Laurent

Respostas:


6

Eu acho que uma pergunta melhor é : eles são significativamente diferentes?

Para responder a isso, precisamos calcular . Chame essa quantidade . Se , há chances iguais de que um seja maior que o outro. Por outro lado, se estiver realmente próximo de 1, podemos ter certeza de que sim é maior (leia-se: diferente) que .P(λ2>λ1)pp0.50pλ2λ1

Como computamos ? É trivial em uma estrutura Bayesian MCMC. Como temos amostras do posterior, vamos calcular a probabilidade de que as amostras de sejam maiores que :pλ2λ1

 p = np.mean( lambda_2_samples > lambda_1_samples )
 print p

Peço desculpas por não ter incluído isso no livro, vou adicioná-lo definitivamente, pois acho que é uma das idéias mais úteis na inferência bayesiana


5
A probabilidade é de 1,0, são diferentes, pois são variáveis ​​aleatórias contínuas. Considere: qual é o seu palpite anterior de que ? Você realmente acha que eles são iguais? (Ignore o teste de hipóteses: estamos vivendo no mundo real, onde as variáveis ​​nunca são realmente iguais). Veja este post do meu herói, Gelman. Computacionalmente, você pode testar isso computando . λ1=λ2np.mean( lambda_2_samples != lambda_1_samples)
Cam.Davidson.Pilon

11
Você pode definir como 'diferente' é significativo. Por exemplo, se, no seu exemplo, qualquer diferença menor que uma não for praticamente significativa, você poderá ver e isso forneceria uma estatística significativa paraP(|λ1λ2|>1)P(λ1λ2)
Sam Dickson

3
Para adicionar ao meu comentário anterior, se as variáveis e forem discretas, há uma chance de que = . λ1λ2λ2λ1
Cam.Davidson.Pilon

11
Oh Deus, eu odiaria estar nessa situação! Envolve integrais desagradáveis. Para a maioria dos modelos, não é possível derivar as partes posteriores. Mesmo se você pudesse, ainda seria melhor usar um computador, apenas para obter amostras. Em resumo, amostras> fórmulas para cálculos como este.
Cam.Davidson.Pilon

2
Você não está medindo "suficientemente maior". Considere uma distribuição com um pico em zero e outra com massas iguais nos picos -10, 10. Sua estatística - o valor esperado do indicador de que uma amostra é maior que a outra - fornece 0,5, mas as distribuições são claramente totalmente diferentes.
Neil G

5

Como afirmado, essa pergunta é trivial. Supondo que e são variáveis ​​aleatórias contínuas, .λ1λ2Pr(λ1=λ2)=0

Eu suspeito que você esteja interessado na probabilidade de que e estejam a alguns um do outro. Nesse caso, a área da diferença nas duas densidades posteriores no intervalo é a sua resposta. Valores maiores de sobreposição indicam que os dois posteriores são mais semelhantes.λ 2 ϵ [ - ϵ / 2 , ϵ / 2 ]λ1λ2ϵ[ϵ/2,ϵ/2]

Se você preferir trabalhar com resultados simulados (e para a maioria dos problemas, não temos o luxo de escolher), basta considerar a proporção dos resultados em que como uma aproximação.λ2>λ1


Obrigado. Como sua resposta se relaciona com algumas das idéias discutidas nos comentários do OP?
Amelio Vazquez-Reina

Desculpas, mas não estou familiarizado com nenhum desses métodos, por isso não posso comentar significativamente. @ Stéphane_Laurent é bastante inteligente, então eu recomendo olhar no link, no mínimo.
Sycorax diz Restabelecer Monica

11
@ user023472 Desculpe, hoje não tenho energia para responder sobre a abordagem de discrepância intrínseca. Baseia-se na divergência Kullback-Leibler.
Stéphane Laurent

@ user777 Isto requer fixação . E se eu apenas quiser ver a probabilidade ou ? p ( λ 2 > λ 1 ) p ( λ 2λ 1 )ϵp(λ2>λ1)p(λ2λ1)
Amelio Vazquez-Reina

Obrigado @ user777. Estou interessado no caso em que não temos acesso às amostras. Você teve uma integral em sua postagem anteriormente, mas parece que a excluiu. Como seria essa integral?
Amelio Vazquez-Reina
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.