Se 'B é mais provável dado A', então 'A é mais provável dado B'


9

Estou tentando obter uma intuição mais clara por trás: "Se torna mais provável, então torna mais provável"ABBA

Seja o tamanho do espaço em que e estão, entãon(S)AB

Reivindicação: entãoP(B|A)>P(B)n(AB)/n(A)>n(B)/n(S)

entãon(AB)/n(B)>n(A)/n(S)

que éP(A|B)>P(A)

Eu entendo a matemática, mas por que isso faz sentido intuitivamente?


11
Editei a pergunta para remover a palavra 'make'. Essa pergunta parecia um pouco com as perguntas ambíguas no Facebook, aquelas em que você precisa resolver alguma soma algébrica com fotos e as pessoas obtêm respostas muito diferentes devido a diferentes interpretações da pergunta. Isso não é algo que queremos aqui. (uma alternativa é encerrar a questão por não ser clara e fazer com que o OP a altere).
Sextus Empiricus

Respostas:


10

Por intuição, exemplos do mundo real, como Peter Flom dá, são mais úteis para algumas pessoas. A outra coisa que geralmente ajuda as pessoas são as fotos. Então, para cobrir a maioria das bases, vamos tirar algumas fotos.

Diagrama de probabilidade condicional mostrando independência Diagrama de probabilidade condicional mostrando dependência

O que temos aqui são dois diagramas muito básicos mostrando probabilidades. O primeiro mostra dois predicados independentes que chamarei de vermelho e liso. É claro que eles são independentes porque as linhas estão alinhadas. A proporção da área plana que é vermelha é igual à proporção da área listrada que é vermelha e também é a mesma que a proporção total que é vermelha.

Na segunda imagem, temos distribuições não independentes. Especificamente, expandimos parte da área vermelha lisa para a área listrada sem alterar o fato de ser vermelha. Claramente, então, ser vermelho torna mais provável que seja simples.

Enquanto isso, dê uma olhada no lado liso dessa imagem. Claramente, a proporção da região plana que é vermelha é maior que a proporção da imagem inteira que é vermelha. Isso ocorre porque a região da planície recebeu muito mais área e tudo é vermelho.

Portanto, o vermelho torna mais provável a planície e a planície torna mais provável o vermelho.

O que realmente está acontecendo aqui? A é uma evidência de B (ou seja, A aumenta a probabilidade de B) quando a área que contém A e B é maior do que seria previsto se fossem independentes. Como a interseção entre A e B é igual à interseção entre B e A, isso também implica que B é uma evidência para A.

Uma nota de cautela: embora o argumento acima pareça muito simétrico, pode não ser que a força da evidência em ambas as direções seja igual. Por exemplo, considere esta terceira imagem.Diagrama de probabilidade condicional mostrando dependência extrema
Aqui aconteceu o mesmo: o vermelho comum consumiu território anteriormente pertencente ao vermelho listrado. De fato, terminou completamente o trabalho!

Observe que o ponto sendo vermelho garante a simplicidade porque não há regiões vermelhas listradas. No entanto, um ponto simples não garante vermelhidão, porque ainda existem regiões verdes. No entanto, um ponto na caixa sendo simples aumenta a chance de ser vermelho, e um ponto sendo vermelho aumenta a chance de ser simples. Ambas as direções implicam mais provável, mas não na mesma quantidade.


Gosto das imagens :) No entanto, parece que as imagens ou a explicação estão invertidas: In the second image, we have non-independent distributions. Specifically, we have moved some of the stripy red area into the plain area without changing the fact that it is red. Clearly then, being red makes being plain more likely. - sua segunda imagem ganhou área simples que a primeira; portanto, passando da imagem 1 para 2, movemos a área simples para a área listrada.
Pod

Portanto, se eu tiver um diagrama de Venn com alguma área de interseção A, B comum e tudo o que faço é aumentar essa área de interseção, adiciono automaticamente mais A, B para todo o espaço (sem aumentar o espaço) e altero / aumenta n (A ) / n (S) e n (B) / n (S) como consequência. Direita? Mais comentários?
Rahul Deora

4
Vermelho versus verde é uma combinação problemática para pessoas daltônicas.
Richard Hardy

@Pod Acho que é uma ambiguidade da linguagem natural que você está descrevendo. Leia "movemos parte da área vermelha listrada para a área plana" como "movemos parte da área conhecida anteriormente como vermelho listrado e a alteramos para a área plana". Eu acho que você leu errado como "nós expandimos parte da área vermelha listrada para a área anteriormente conhecida como planície" .
Peter - Restabelece Monica

20

Eu acho que outra maneira matemática de colocar isso pode ajudar. Considere a afirmação no contexto da regra de Bayes:

Reivindicação: se entãoP(B|A)>P(B)P(A|B)>P(A)

Regra de Bayes:

P(AB)=P(BA)P(A)P(B)

assumindo diferente de zero. portantoP(B)

P(A|B)P(A)=P(B|A)P(B)

Se , então .P(B|A)>P(B)P(B|A)P(B)>1

Então , e então .P(A|B)P(A)>1P(A|B)>P(A)

Isso prova a afirmação e uma conclusão ainda mais forte - que as respectivas proporções das probabilidades devem ser iguais.


Eu gostei porque mostra o elo mais forte "Se um faz B x por cento mais provável, então B faz um x por cento mais provável"
probabilityislogic

@probabilityislogic Expressar dessa maneira introduz ambiguidade. Se a probabilidade anterior é de 10% e a posterior é de 15%, a probabilidade aumentou 5% (15% menos 10%) ou 50% (15% dividido por 10%)?
Acumulação

P(B|A)>P(B)P(A|B)=P(B|A)P(A)/P(B)>P(B)P(A)/P(B)=P(A)

12

Bem, eu não gosto da palavra "faz" na pergunta. Isso implica algum tipo de causalidade e a causalidade geralmente não se inverte.

Mas você pediu intuição. Então, eu pensaria em alguns exemplos, porque isso parece desencadear intuição. Escolha uma que você goste:

Se uma pessoa é uma mulher, é mais provável que ela tenha votado em um democrata.
Se uma pessoa votou em um democrata, é mais provável que ela seja uma mulher.

Se um homem é um centro profissional de basquete, é mais provável que ele tenha mais de 2 metros de altura.
Se um homem tem mais de 2 metros de altura, é mais provável que ele seja um centro de basquete.

Se estiver acima de 40 graus Celsius, é mais provável que ocorra um apagão.
Se houve um blecaute, é mais provável que esteja acima de 40 graus.

E assim por diante.


4
Isso não é sobre probabilidade. Isso é cerca de 1 para 1 relacionamentos.
Peter Flom - Restabelece Monica

6
@jww Imagine a afirmação "se estiver chovendo, a rua está molhada" (e suponha que seja uma implicação válida no momento, enquanto o inverso não estiver). Agora colete um grande número de "amostras" em diferentes épocas e lugares, onde você registra se está chovendo e se a rua está molhada. A rua estará molhada em mais amostras onde está chovendo do que nas amostras onde não está; mas também estará chovendo em mais amostras onde a rua está molhada do que nas amostras em que a rua está seca. Essa é a probabilidade.
precisa saber é o seguinte

3
Ambos os fenômenos são causados ​​pela mesma implicação; a implicação funciona apenas de uma maneira, mas observar o consequente torna mais provável que você esteja vendo uma amostra em que o antecedente é verdadeiro.
Hbbs #

7
@ Barmar Desculpe, mas isso demonstra em parte a correção da minha lógica. Porque digamos 36 / 25.000 é muito maior que 1 / 150.000.000.
Peter Flom - Restabelece Monica

7
Mais provável do que alguém com menos de 2 metros de altura.
Peter Flom - Restabelece Monica

9

P(A)>0,P(B)>0

η(A,B)=P(AB)P(A)P(B)
ηABAB

P(AB)P(A)P(B)>1P(BA)>P(B)P(AB)P(A)P(B)ABABP(AB)>P(A)η(A,B)AB

A resposta do @gunes deu um exemplo prático, e é fácil fazer os outros da mesma maneira.


2

Se A aumenta a probabilidade de B, isso significa que os eventos estão de alguma forma relacionados. Essa relação funciona nos dois sentidos.

Se A aumenta a probabilidade de B, isso significa que A e B tendem a acontecer juntos. Isso significa que B também torna A mais provável.


11
Isso talvez possa usar alguma expansão? Sem uma definição de relacionado, é um pouco vazio.
Mdewey

2
Eu estava tentando ficar longe de qualquer coisa rigorosa, já que o OP pedia uma explicação intuitiva. Você está certo de que está bastante vazio como está agora, mas não sei como expandi-lo de maneira intuitiva. Eu adicionei uma tentativa.
Dasherman 14/04/19

2

Se A torna B mais provável, A possui informações cruciais que B podem inferir sobre si. Apesar de poder não contribuir com a mesma quantidade, essas informações não são perdidas ao contrário. Eventualmente, temos dois eventos em que sua ocorrência se apoia. Não consigo imaginar um cenário em que a ocorrência de A aumente a probabilidade de B e a ocorrência de B diminua a probabilidade de A. Por exemplo, se chover, o chão ficará molhado com alta probabilidade e se o chão estiver molhado, não significa que chove, mas não diminui as chances.


2

Você pode tornar a matemática mais intuitiva imaginando uma tabela de contingência.

A¬Aa+b+c+da+cb+dBa+bab¬Bc+dcd

  • AB

    A¬A1x1xBya=xyb=(1x)y¬B1yc=x(1y)d=(1x)(1y)
    P(A)=P(A|B)P(B)=P(B|A)

  • a,b,c,d±z

    A¬A1x1xBya+zbz¬B1yczd+z

    z

    P(A|B)P(A)P(B|A)P(B)>z<z

P(A|B)>P(A)P(B|A)>P(B)P(B,A)>P(A)P(B)

Se A e B frequentemente acontecem juntos (a probabilidade conjunta é maior que o produto das probabilidades marginais), a observação de um aumentará a probabilidade (condicional) do outro.


2

Suponha que denotemos a razão de probabilidade posterior para anterior de um evento como:

Δ(A|B)P(A|B)P(A)

Então uma expressão alternativa do teorema de Bayes (veja este post relacionado ) é:

Δ(A|B)=P(A|B)P(A)=P(AB)P(A)P(B)=P(B|A)P(B)=Δ(B|A).

BAAB


ABdo


1

Disseram-lhe que Sam é uma mulher e Kim é um homem, e um dos dois usa maquiagem e o outro não. Qual deles você acha que usa maquiagem?

Disseram-lhe que Sam usa maquiagem e Kim não, e um dos dois é um homem e um é uma mulher. Quem você acha que é a mulher?


Não é tão simples conectar isso ao problema original. O que exatamente é o evento A e o que é o evento B? Aqui parece mais uma comparação de probabilidades. O evento A é 'x é uma mulher' (não A é o evento 'x é um homem'). E o evento B é 'x usa maquiagem'. Mas agora, de repente, temos um Sam e um Kim, de onde isso vem e devemos usar alguma informação sobre a masculinidade ou feminilidade subjetiva de seus nomes?
Sextus Empiricus

1

Parece que há alguma confusão entre causação e correlação. De fato, a declaração da pergunta é falsa para a causalidade, como pode ser visto por um exemplo como:

  • Se um cachorro está usando um cachecol, é um animal domesticado.

O seguinte não é verdadeiro:

  • Ver um animal domesticado usando um cachecol implica que é um cachorro.
  • Ver um cão domesticado implica que ele está usando um cachecol.

No entanto, se você está pensando em probabilidades (correlação), então é verdade:

  • Cães que usam lenços têm muito mais probabilidade de serem animais domesticados do que cães que não usam lenços (ou animais em geral)

O seguinte é verdadeiro:

  • Um animal domesticado usando um cachecol é mais provável que seja um cachorro do que outro animal.
  • Um cão domesticado tem mais probabilidade de usar um cachecol do que um cão não domesticado.

Se isso não for intuitivo, pense em uma piscina de animais, incluindo formigas, cães e gatos. Cães e gatos podem ser domesticados e usar lenços, as formigas também não.

  1. Se você aumentar a probabilidade de animais domesticados em sua piscina, isso também significa que você aumentará a chance de ver um animal usando um cachecol.
  2. Se você aumentar a probabilidade de gatos ou cães, também aumentará a probabilidade de ver um animal usando um cachecol.

Ser domesticado é o elo "secreto" entre o animal e usar um cachecol, e esse elo "secreto" exercerá sua influência nos dois sentidos.

Editar: dando um exemplo para sua pergunta nos comentários:

Imagine um mundo onde os animais sejam gatos ou cães. Eles podem ser domesticados ou não. Eles podem usar um cachecol ou não. Imagine que existem 100 animais no total, 50 cães e 50 gatos.

Agora considere a afirmação A: "Os cães que usam cachecóis têm três vezes mais chances de serem animais domesticados do que os que não usam cachecóis ".

Se A não for verdadeiro, você pode imaginar que o mundo poderia ser composto por 50 cães, 25 deles domesticados (dos quais 10 usam cachecóis), 25 deles selvagens (dos quais 10 usam cachecóis). Mesmas estatísticas para gatos.

Então, se você visse um animal domesticado neste mundo, ele teria 50% de chance de ser um cachorro (25/50, 25 cães em 50 animais domesticados) e 40% de chance de ter um cachecol (20/50, 10 cães) e 10 gatos de 50 animais domesticados).

No entanto, se A é verdade, você tem um mundo onde existem 50 cães, 25 deles domesticados (dos quais 15 usam cachecóis ), 25 deles selvagens (dos quais 5 usam cachecóis ). Os gatos mantêm as estatísticas antigas: 50 gatos, 25 deles domesticados (dos quais 10 usam cachecóis), 25 deles selvagens (dos quais 10 usam cachecóis).

Então, se você visse um animal domesticado nesse mundo, teria 50% de chance de ser um cachorro (25/50, 25 cães em 50 animais domesticados), mas 50% (25/50, 15 cães e gatos). 10 gatos em 50 animais domesticados).

Como você pode ver, se você diz que A é verdade, se você viu um animal domesticado usando um cachecol no mundo, seria mais provável que um cão (60% ou 15/25) do que qualquer outro animal (neste caso Cat, 40% ou 25/10).


Essa é a linha com a qual tenho um problema: "Um animal domesticado usando um cachecol tem mais probabilidade de ser um cachorro do que outro animal". Quando fizemos nossa declaração inicial, não reivindicamos outros animais que poderiam usar lenços. Poderia haver 100s. Fizemos apenas uma declaração sobre cães.
Rahul Deora

Veja se minha edição ajuda com seu problema específico.
H4uZ 15/04/19

0

Há uma confusão aqui entre causação e correlação. Então, eu vou dar um exemplo onde o oposto exato acontece.

Algumas pessoas são ricas, outras são pobres. Algumas pessoas pobres recebem benefícios, o que as torna menos pobres. Mas as pessoas que obtêm benefícios têm maior probabilidade de serem pobres, mesmo com benefícios.

Se você receber benefícios, isso aumenta a probabilidade de você poder comprar ingressos de cinema. ("Torna mais provável" significa causalidade). Mas se você pode comprar ingressos para o cinema, isso torna menos provável que você esteja entre as pessoas pobres o suficiente para obter benefícios; portanto, se você pode comprar ingressos para o cinema, é menos provável que obtenha benefícios.


5
Esta não é uma resposta para a pergunta. Interessante, mas não uma resposta. De fato, está falando de um cenário diferente; a razão pela qual o oposto acontece é que ele usa duas métricas diferentes nomeadas de maneira semelhante (ruim sem benefícios x ruim com benefícios) e, como tal, é um cenário completamente diferente.
precisa saber é o seguinte

0

A intuição fica clara se você olhar para a afirmação mais forte:

Se A implica B, então B torna A mais provável.

Implication:
  A true  -> B true
  A false -> B true or false
Reverse implication:
  B true  -> A true or false
  B false -> A false

Obviamente, A é mais provável que seja verdade se B também é conhecido, porque se B era falso, então seria A. A mesma lógica se aplica à afirmação mais fraca:

Se A torna B mais provável, então B torna A mais provável.

Weak implication:
  A true  -> B true or (unlikely) false
  A false -> B true or false
Reverse weak implication:
  B true  -> A true or false
  B false -> A false or (unlikely) true

Acho que o que você está dizendo na primeira afirmação é que, em um diagrama de venn, se A está contido em B, se B for verdadeiro n (A) / n (B) deve ser maior que n (A) / n (S) como B é um espaço menor que S. Mesmo no segundo, você diz o mesmo?
Rahul Deora

@RahulDeora - Sim, é assim que funciona. A versão fraca é muito menos óbvia, mas você já fez as contas de qualquer maneira. O que você pediu é a intuição por trás do resultado, que pode ser melhor observada na declaração mais forte.
Rainer P.

Um pequeno problema com o uso dessa afirmação para obter um pouco mais de intuição é que ela não é totalmente verdadeira. 'A implicando B' não é uma condição suficiente para 'quando B então A é mais provável'. A distinção importante é que, com 'A implicando B', não é necessário torná-lo mais provável. Os exemplos mais importantes são quando B é sempre verdadeiro.
Sextus Empiricus

0

P(successful|Alice)>P(successful)P(Alice|successful)>P(Alice)

Ou suponha que exista uma escola que tenha 10% dos alunos em seu distrito escolar, mas 15% dos alunos diretos. Então, claramente, a porcentagem de alunos da escola que são alunos diretos A é superior à porcentagem de todo o distrito.

P(A&B)>P(A)P(B)AB

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.