Essa quantidade relacionada à independência tem um nome?


18

Obviamente, os eventos A e B são independentes se Pr = Pr Pr . Vamos definir uma quantidade relacionada Q:(AB)(A)(B)

QPr(AB)Pr(A)Pr(B)

Então A e B são independentes se Q = 1 (assumindo que o denominador é diferente de zero). Q realmente tem um nome? Eu sinto que isso se refere a algum conceito elementar que está me escapando agora e que eu me sentirei bastante tolo por perguntar isso.


1
Eu acho que depende do contexto. Observe que para que \ Pr (A | B) = Q \ Pr (A) e \ Pr (B | A) = Q \ Pr (B) . Este formulário tem mais um sabor de inferência bayesiana. Pr(A|B)=QPr(A)Pr(B|A)=QPr(B)
Q=Pr(A|B)Pr(A)=Pr(B|A)Pr(B)
Pr(A|B)=QPr(A)Pr(B|A)=QPr(B)
vqv

Esse SE poderia ter outras perguntas "bastante tolas". É muito intimidador, mesmo para quem gosta de estatísticas básicas de graduação. 1 para disparate
naught101


1
Vá em "Migdal Probability";)
Bitwise

1
@PiotrMigdal Obrigado pela gentil oferta. Eu preferiria ver sua própria resposta. Talvez incluindo como você fez essa pergunta e como essa quantidade pode ser útil.

Respostas:


14

Observa- se a proporção esperada (abreviação: o / e ).

Citando uma resposta para Sobre a probabilidade conjunta dividida pelo produto das probabilidades no Math.SE (apontado pelo procrastinador ):

Então, pelo menos na literatura ambiental, médica e das ciências da vida, P (A∩B) / (P (A) P (B)) é chamada de razão observada para a esperada (abreviação o / e). A idéia é que o numerador seja a probabilidade real de A∩B enquanto o denominador é o que seria se A e B fossem independentes.


11

Eu acho que você está procurando Lift(ou melhoria). Lift é a razão da probabilidade de que A e B ocorram juntos para o múltiplo das duas probabilidades individuais de A e B. É usado para interpretar a importância de uma regra na mineração de regras de associação . A elevação é uma maneira de medir o quão melhor um modelo está acima do benchmark e é definida como a confiança dividida pelo benchmark, em que qualquer valor maior que aquele sugere que há alguma utilidade para a regra. Veja esta página também como outro exemplo.


(+1) Boa resposta. A vinheta das arules também tem boas referências sobre levantamento .
chl

Obrigado, provavelmente é onde eu já vi isso antes. Acho que já vi uma definição ligeiramente diferente no contexto de aprendizado de máquina ... Odeio que às vezes haja falta de consenso sobre uma definição, enquanto outras vezes há muitos termos para o mesmo conceito.
Michael McGowan

8

O pessoal da análise de correspondência chama uma dessas quantidades de razão de contingência , no contexto de contagens cruzadas. As distâncias de múltiplas proporções de 1 são o que os biplots visualizam. Ver, por exemplo, Greenacre (1993), cap.13.

O pessoal da seleção de recursos de aprendizado de máquina da velha escola chama o registro dessa quantidade de informações mútuas pontuais . Ver, por exemplo, Manning e Schütze (1999) p.66.


Obrigado por apontar "taxa de contingência" e "informações mútuas pontuais".
Piotr Migdal


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.