A direção das arestas em uma rede Bayes é irrelevante?


10

Hoje, em uma palestra, foi afirmado que a direção das arestas em uma rede Bayes realmente não importa. Eles não precisam representar causalidade.

É óbvio que você não pode mudar nenhuma borda em uma rede Bayes. Por exemplo, seja com V = { v 1 , v 2 , v 3 } e E = { ( v 1 , v 2 ) , ( v 1 , v 3 ) , ( v 2 , v 3 ) } . Se você alternar ( vG=(V,E)V={v1,v2,v3}E={(v1,v2),(v1,v3),(v2,v3)} a ( v 3 , v 1 ) , então G não seria mais acíclico e, portanto, não seria uma rede Bayes. Este parece ser principalmente um problema prático como estimar as probabilidades então. Este caso parece ser muito mais difícil de responder, por isso vou ignorá-lo.(v1,v3)(v3,v1)G

Isso me fez fazer as seguintes perguntas para as quais espero obter respostas aqui:

  1. É possível que qualquer gráfico acíclico direcionado (DAG) inverta todas as arestas e ainda tenha um DAG?
  2. Suponha um DAG e os dados sejam fornecidos. Agora construímos o DAG inverso G inv . Para os dois DAGs, ajustamos os dados às redes Bayes correspondentes. Agora, temos um conjunto de dados para o qual queremos usar a rede Bayes para prever os atributos ausentes. Poderia haver resultados diferentes para os dois DAGs? (Bônus se você vier com um exemplo)GGinv
  3. Semelhante a 2, mas mais simples: suponha que um DAG e os dados sejam fornecidos. Você pode criar um novo gráfico G ' invertendo qualquer conjunto de arestas, desde que G ' permaneça acíclico. As redes Bayes são equivalentes quando se trata de suas previsões?GGG
  4. Conseguimos algo se temos arestas que representam causalidade?

Respostas:


6

TL; DR: às vezes você pode criar uma rede bayesiana equivalente invertendo as setas e às vezes não.

Simplesmente reverter a direção das setas gera outro gráfico direcionado, mas esse gráfico não é necessariamente o gráfico de uma rede bayesiana equivalente, porque as relações de dependência representadas pelo gráfico de seta reversa podem ser diferentes daquelas representadas pelo gráfico original. Se o gráfico de seta reversa representa relações de dependência diferentes do original, em alguns casos, é possível criar uma rede bayesiana equivalente adicionando mais algumas setas para capturar relações de dependência que estão faltando no gráfico de seta reversa. Mas, em alguns casos, não existe uma rede bayesiana exatamente equivalente. Se você precisar adicionar algumas setas para capturar dependências,

Por exemplo, a -> b -> crepresenta as mesmas dependências e independências que a <- b <- c, e o mesmo que a <- b -> c, mas não o mesmo que a -> b <- c. Este último gráfico diz que ae cé independente se bnão for observado, mas a <- b -> cdiz ae cé dependente nesse caso. Podemos acrescentar uma borda diretamente do aque cpara capturar isso, mas, em seguida, ae cser independente quando bé observado não está representada. Isso significa que existe pelo menos uma fatoração que não podemos explorar ao calcular probabilidades posteriores.

Todo esse material sobre dependência / independência, flechas e suas inversões, etc., é abordado em textos padrão em redes bayesianas. Eu posso desenterrar algumas referências, se você quiser.

As redes bayesianas não expressam causalidade. Judea Pearl, que trabalhou muito em redes bayesianas, também trabalhou no que ele chama de redes causais (essencialmente redes bayesianas anotadas com relações causais).


Isso responde às perguntas (2) e (3). Você tem uma idéia sobre a pergunta (1) e (4) também? (Sim, referências seria bom)
Martin Thoma

(1) Considere o contrapositivo: se o gráfico de seta reversa tiver um ciclo direcionado, seguir as setas ao redor do ciclo para trás deve ser um ciclo direcionado no gráfico original. (4) As redes bayesianas são modelos probabilísticos e, como tal, não representam causalidade. É possível que algumas setas realmente se refiram a relações causais, mas isso é perdido em um modelo probabilístico. Talvez acausas b, mas a -> be a <- bsão modelos probabilísticos igualmente válidos.
Robert Dodier

Algumas referências introdutórias. Koller & Friedman: "Modelos Gráficos Probabilísticos". Cowell, Dawid, Lauritzen e Spiegelhalter: "Redes Probabilísticas e Sistemas Especialistas". Castillo, Gutierrez e Hadi: "Sistemas especialistas e modelos probabilísticos de rede".
Robert Dodier

Você pode reverter qualquer seta e obter uma Rede Bayesiana equivalente, desde que você mantenha as v-estruturas (não reverter uma flecha que outra flecha também está apontando para o nó que está apontando)
borgr

1

Isso pode ser um pouco insatisfatório, portanto, fique à vontade para não aceitar esta resposta e peça desculpas antecipadamente.

Em uma rede de Bayes, os nós representam variáveis ​​aleatórias e as arestas representam dependências condicionais. Quando você interpreta os nós de uma certa maneira, o condicionamento flui de uma certa maneira naturalmente. Revertê-los arbitrariamente não faz muito sentido no contexto da modelagem de dados. E muito tempo, as flechas representam causalidade.


11
Isso está bem longe da realidade. A interpretação "natural" é algo imposto ao modelo, não faz parte do próprio modelo. Você pode reverter dependências (adicionando arestas adicionais conforme necessário para preservar o conjunto de dependências representadas pela rede) e ainda é uma rede bayesiana. Se faz sentido não é responsável, examinando apenas a própria rede. Aliás, a Judea Pearl, uma das grandes empresas por trás das redes bayesianas nos anos 80 e 90, vem trabalhando mais recentemente em modelos formais de causalidade, que expressam relações causais no modelo.
Robert Dodier

Você diz: "se faz sentido, não é responsável pelo exame apenas da própria rede". Eu nunca disse que era. Eu disse "quando você interpreta os nós de uma certa maneira, o condicionamento flui de uma certa maneira ..." Isso provavelmente reflete meu viés; você pode chamar as coisas em que trabalho em uma rede bayes, mas essa pergunta nunca me ocorreu. Por exemplo, se dois nós representassem a mesma variável em momentos diferentes, não haveria dúvida sobre qual direção o condicionamento flui. Aceito a possibilidade, no entanto, de que existem situações em que as pessoas podem usar essas redes de Baye de maneira menos rígida.
Taylor

0

Questão 3

synergy.st-andrews.ac.uk/vannesmithlab afirma que os gráficos

G1 = o->o->o and
G2 = o<-o->o

estão em uma classe de equivalência. Segundo essa fonte, os modelos representam exatamente a mesma distribuição de probabilidade conjunta.


Isso não pode estar certo. Para G1, o primeiro e o último dependem da ausência de valores conhecidos. Para G2, o primeiro e o último não dependem da ausência de valores conhecidos. Você quis escrever em G2 = o <- o -> ovez disso? De qualquer forma, não estou vendo uma reivindicação sobre esses gráficos específicos na página da web que você referenciou; talvez você possa ser mais específico.
Robert Dodier
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.