No problema de triagem de mamografia comumente mencionado, com uma probabilidade de triagem de 80%, um valor anterior a 10% e uma taxa de falsos positivos de 50%, ou suas variantes, é fácil explicar que a probabilidade condicional posterior de uma triagem positiva indicar um câncer está presente é de apenas 15%. Isso é mostrado com mais facilidade por contagens, com n = 1000, casos de câncer verdadeiros = 100, cânceres detectados = 80 e falsos positivos = 450. Então a probabilidade de uma triagem positiva indicar um câncer presente é verdadeiros positivos / (verdadeiros positivos + falsos positivos) ou 80 / (100 + 450) = 0,145 ou 15%.
A intuição é que os verdadeiros positivos são condicionados à soma dos verdadeiros e falsos positivos, porque a soma dos verdadeiros e falsos positivos constitui um subconjunto de todos os resultados. Isso ocorre porque os falsos negativos e os verdadeiros negativos são excluídos do cálculo e, portanto, o conjunto condicional é um subconjunto.
Se mudarmos o problema para o caso contínuo com uma probabilidade binomial e um beta anterior, a constante de normalização se tornará integral, como no verdadeiro termo positivo (p = proporção)
e um termo semelhante para os falsos positivos.
O que não está claro, no entanto, é como reafirmar a idéia de um subconjunto no caso contínuo, e não consigo encontrar ninguém que faça isso. Em vez disso, encontra-se a linguagem em que 1) essa integral fornece a constante para fazer o cálculo necessário para ter uma distribuição de probabilidade definida no intervalo [0, 1] ou 2) que a proporcionalidade é invocada e o valor da integral não é necessário para encontre o posterior, especialmente usando o MCMC, ou 3) a integral é a probabilidade da evidência. Essa última explicação parece mais próxima da idéia de um subconjunto, mas não está clara e explicitamente conectada.
Estou escrevendo uma introdução intuitiva ao teorema de Bayes e quero continuar a idéia intuitiva de um subconjunto para a probabilidade condicional que define o posterior. Então, preciso de uma linguagem para explicar como essa integral é apenas a reafirmação contínua do subconjunto no caso dos números discretos.
Alguma sugestão?