@gung tem uma ótima resposta. Eu acrescentaria um exemplo para explicar a "iniciação" em um exemplo do mundo real.
Para uma melhor conexão com exemplos do mundo real, eu gostaria de mudar a notação, onde use para representar a hipótese (o A em sua equação) e use E para representar evidências. (o B na sua equação.)HAEB
Então a fórmula é
P(H|E)=P(E|H)P(H)P(E)
Observe que a mesma fórmula pode ser escrita como
P(H|E)∝P(E|H)P(H)
onde significa proporcional a e P ( E | H ) é a probabilidade e P ( H ) é a anterior . Esta equação significa que o posterior será maior, se o lado direito da equação maior. E você pode pensar que P ( E ) é uma constante de normalização para tornar o número em probabilidade (a razão pela qual digo que é uma constante é porque a evidência E já é fornecida).∝P(E|H)P(H)P(E)E
Para um exemplo do mundo real, suponha que estamos fazendo alguma detecção de fraude nas transações com cartão de crédito. Então a hipótese seria onde representar que a transação é normal ou fraudulenta. (Eu escolhi um caso extremamente desequilibrado para mostrar a intuição).H∈{0,1}
Pelo conhecimento do domínio, sabemos que a maioria das transações seria normal, apenas muito poucas são fraudulentas. Vamos supor que um especialista nos disse que há em 1000 seria fraude. Então, podemos dizer que o anterior é P ( H = 1 ) = 0,001 e P ( H = 0 ) = 0,999 .11000P(H=1)=0.001P(H=0)=0.999
O objetivo final é calcular que significa que queremos saber se uma transação é uma fraude que não se baseia nas evidências além das anteriores . Se você olhar para o lado direito da equação, decomporemos em probabilidade e anterior .P(H|E)
Onde já explicamos o que é anterior , aqui explicamos o que é probabilidade. Suponha que temos dois tipos de provas, que representam, se estamos vendo localização geográfica normal ou estranho da transação.E∈{0,1}
P(E=1|H=0)P(E=1|H=1)
E=1