Pergunta Restatement and Generalization
A , e são incógnitas binárias cujos valores possíveis são e . Deixe defender a proposição "O valor de é ". Também deixe representar "A probabilidade de que , dado esse ". O que é , dado queBC01ZiZi(X|Y)XY(Aa|BbCcI)
- (Aa1|Bb1I)=u1 e(Aa2|Cc2I)=u2
- (Aa1|Bb1I)=u1 e e(Aa2|Cc2I)=u2(BC|I)=(B|I)(C|I)
- (Aa1|Bb1I)=u1 e e(Aa2|Cc2I)=u2(A0|I)=12
- (Aa1|Bb1I)=u1 e e e(Aa2|Cc2I)=u2(A0|I)=12(BC|I)=(B|I)(C|I)
e que não contém informações relevantes além do que está implícito nas atribuições? O último conjunto de condições 2 e 4 é um atalho para a declaração de independência
tratar cada dos quatro casos, por sua vez.I(BjCk|I)=(Bj|I)(Ck|I),j=0,1k=0,1
Respostas
Caso 1
Temos que especificar a distribuição . O problema é subdeterminado, porque requer oito números, mas temos apenas três equações - as duas condições fornecidas e a condição de normalização.(ABC|I)(ABC|I)
Foi demonstrado por vários meios esotéricos que a distribuição a ser atribuída quando a informação não determina uma solução é a que, de todas as distribuições consistentes com a informação conhecida, possui a maior entropia. Qualquer outra distribuição implica que sabemos mais do que as informações conhecidas, o que obviamente é uma contradição.
Tudo o que precisamos fazer, portanto, é atribuir a distribuição máxima de entropia. É mais fácil dizer do que fazer, e não encontrei uma solução geral de forma fechada. Porém, soluções específicas podem ser encontradas usando um otimizador numérico. Maximizamos
sujeito às restrições
e
e
Agora vamos aplicar isso à pergunta. Se tiver-mos−∑i,j,k(AiBjCk|I)ln(AiBjCk|I)
∑i,j,k(AiBjCk|I)=1
(Aa1|Bb1I)=u1i.e.∑k(Aa1Bb1Ck|I)∑i,k(AiBb1Ck|I)=u1
(Aa2|Cc2I)=u2i.e.∑j(Aa2BjCc2|I)∑i,j(AiBjCc2|I)=u2
- "A pessoa é mulher"⟷A1
- "A pessoa tem cabelos compridos"⟷B1
- "A pessoa tem sangue tipo AX3"⟷C1
então , , , , , , , , e descobrimos que, para a solução máxima de entropia, . Portanto, a probabilidade de a pessoa por trás da cortina ser do sexo feminino, uma vez que possui cabelos longos e tipo sanguíneo AX3, é de 0,932.a=1b=1c=1a1=1b1=1a2=1c2=1u1=0.9u2=0.8(A1|B1C1I)≃0.932
Caso 2
Agora, repetimos o exercício com a restrição extra de que, para uma determinada pessoa, conhecer o valor de (o estado do cabelo) não afeta nossa estimativa do valor de (o estado do tipo sanguíneo) e vice-versa. Tudo é o mesmo que no Caso 1, exceto que há duas restrições extras na otimização, a saber:
ou seja,
Isso forneceBC(B0|ClI)=(B0|I),l=0,1
∑i(AiB0Cl|I)∑i,j(AiBjCl|I)=∑i,k(AiB0Ck|I),l=0,1
(A1|B1C1I)≃0.936, portanto, a probabilidade de a pessoa por trás da cortina ser do sexo feminino, pois possui cabelos longos e tipo sanguíneo AX3, é de 0,936.
Caso 3
Agora removemos a condição de independência e a substituímos pela condição anterior de que há uma chance igual de uma pessoa ser homem ou mulher:
Desta vez , portanto, a probabilidade de a pessoa atrás da cortina ser do sexo feminino , considerando que ele / ela tem cabelos longos e tipo sanguíneo AX3, é 0,973.(A0|I)=12i.e.∑j,k(A0BjCk|I)=12
(A1|B1C1I)≃0.973
Caso 4
Finalmente, reintroduzimos as restrições de independência do Caso 2 e descobrimos que . Portanto, a probabilidade de a pessoa por trás da cortina ser do sexo feminino, uma vez que possui cabelos longos e tipo sanguíneo AX3, é de 0,989.(A1|B1C1I)≃0.989