Qual é a probabilidade de dado ?

Suponha que $X$ e $Y$ sejam bivariados normais com média $\mu=(\mu_1,\mu_2)$ e covariância $\Sigma = \begin{bmatrix} \sigma_{11} & \sigma_{12} \\ \sigma_{12} & \sigma_{22} \\ \end{bmatrix}$ . Qual é a probabilidade $\Pr\left(X<Y|\min\left(X,Y\right)\right)$ ?

probability normal-distribution conditional-probability

— Mike
fonte

@whuber certo obrigado, excluí meus pensamentos, pois eles não estão adicionando nada aqui.

— AdamO 6/07/19

\frac{P r (m < Y | X = m)}{P r (m < Y | X = m) + P r (m < X | Y = m)}

$\frac{Pr(m<Y|X=m)}{Pr(m<Y|X=m)+Pr(m<X|Y=m)}$

— Sextus Empiricus

link útil stats.stackexchange.com/questions/30588/… Esta é uma pergunta de auto-estudo?

— Sextus Empiricus

Você deve compartilhar seus pensamentos sobre o problema, independentemente do fato de isso parecer uma pergunta de auto-estudo.

— StubbornAtom

Respostas:

Usando a notação um pouco mais explícita , onde é um número real, não uma variável aleatória. O conjunto no qual é um caminho em forma de L com dois segmentos semi-abertos: um subindo direto do ponto e outro indo direto para a direita a partir desse mesmo ponto. É claro que na perna vertical, na perna horizontal . $P(X<Y|\min(X, Y)=m)$ $m$ $\min(X,Y) = m$ $(m,m)$ $x<y$ $x>y$

Dada essa intuição geométrica, é fácil reescrever o problema de uma forma equivalente, onde no numerador temos apenas a perna vertical onde no denominador temos a soma das duas pernas. $x<y$

$P(X<Y|\min(X, Y)) = \frac{ \displaystyle P(m<Y|X=m) }{ \displaystyle P(m<Y|X=m) + P(m<X|Y=m) } \tag{1}$

Então agora precisamos calcular duas expressões da forma . Tais probabilidades condicionais da distribuição normal bivariada sempre têm uma distribuição normal com os parâmetros: $P(m<X|Y=m)$ $\mathcal{N}\left(\mu_{X|Y=m}, s^2_{X|Y=m}\right)$

$\mu_{X|Y=m} = \mu_1+\frac{\displaystyle \sigma_{12}}{\displaystyle \sigma_{22}}({m}-\mu_2) \tag{2}$

$s^2_{X|Y=m} = \sigma_{11}-\frac{\displaystyle \sigma_{12}^2}{\displaystyle \sigma_{22}} \tag{3}$

Observe que na definição original do problema, refere a elementos da matriz de covariância, ao contrário da convenção mais comum de usar para o desvio padrão. Abaixo, acharemos mais conveniente usar para a variância para o desvio padrão da distribuição de probabilidade condicional. $\sigma_{ij}$ $\sigma$ $s^2$ $s$

Conhecendo esses dois parâmetros, podemos calcular a probabilidade de partir da função de distribuição cumulativa. $m<X$

$P(m<X|Y=m) = \Phi \left(\frac{\displaystyle \mu_{X;Y=m} -m}{\displaystyle s_{X;Y=m}} \right) \tag{4}$

mutatis mutandis , temos uma expressão semelhante para . Deixei $P(Y>m|X=m)$

$z_{X|Y=m} = \frac{\displaystyle \mu_{X;Y=m} - m}{\displaystyle s_{X;Y=m}} \tag{5}$

$z_{Y|X=m} = \frac{\displaystyle \mu_{Y;X=m} -m}{\displaystyle s_{Y;X=m}} \tag{6}$

Em seguida, podemos escrever a solução completa de maneira compacta em termos dessas duas pontuações : $z$

$P(X<Y|\min(X, Y)=m) = 1 - \frac{ \displaystyle \Phi(z_{X|Y=m}) }{ \displaystyle \Phi(z_{X|Y=m})+\Phi(z_{Y|X=m}) } \tag{7}$

Com base no código de simulação fornecido pelo autor da pergunta, podemos comparar este resultado teórico com os resultados simulados:

— olooney
fonte

Em (3) acho que o lado esquerdo deve ter um quadrado, porque é a variação condicional enquanto o desvio padrão é usado posteriormente.

— Yves

Você está certo @Yves e acredito que minhas edições recentes corrigiram o problema. Obrigado.

— olooney

@olooney, obrigado por esta resposta. Eu posso seguir a derivação e parece correta. No entanto, tentei verificar (1) e (7) em uma simulação e os resultados foram bem diferentes. Você pode ver o meu código R aqui gist.github.com/mikeguggis/d041df05565f63f8be2c6c51f5cf8961

— mike

@ Mike, acho que tive um erro de sinal. Depois de consertar isso, o resultado teórico parece concordar com os resultados da simulação. gist.github.com/olooney/e88a66d2d2fa7f2f0cd0d0dd6b708739

— olooney

@olooney, boa captura. Ainda não consigo entender por que as duas estimativas baseadas em simulação não coincidem (linhas 30 a 32 no meu código).

— mike

A pergunta pode ser reescrita usando uma versão modificada do teorema de Bayes (e um abuso de noção para ) $Pr$

\begin{aligned} P r (X < Y | m Eu n (X, Y) = m) & = \frac{P r (m Eu n (X, Y) = m | X < Y) P r (X < Y)}{P r (m Eu n (X, Y) = m | X < Y) P r (X < Y) + P r (m Eu n (X, Y) = m | X \geq Y) P r (X \geq Y)} \\ = \frac{P r (X < Y, m Eu n (X, Y) = m)}{P r (X < Y, m Eu n (X, Y) = m) + P r (X \geq Y, m Eu n (X, Y) = m)} . \end{aligned}

$\begin{align} Pr(X<Y|min(X,Y) = m) &= \frac{Pr(min(X,Y)=m|X<Y)Pr(X<Y)}{Pr(min(X,Y)=m|X<Y)Pr(X<Y)+Pr(min(X,Y)=m|X\geq Y)Pr(X\geq Y)}\\ &= \frac{Pr(X<Y,min(X,Y)=m)}{Pr(X<Y,min(X,Y)=m)+Pr(X\geq Y,min(X,Y)=m)}. \end{align}$

Defina como o PDF bivariado de e , e . Então $f_{X,Y}$ $X$ $Y$ $\phi(x) = \frac{1}{\sqrt{2\pi}}exp(-\frac{1}{2}x^2)$ $\Phi(x) = \int_{-\infty}^x\phi(t)dt$

\begin{aligned} P r (X < Y, m Eu n (X, Y) = m) & = P r (X = m, Y > m) \\ = \int_{m}^{\infty} f_{X, Y} (m, t) d t \end{aligned}

$\begin{align} Pr(X<Y,min(X,Y)=m) &=Pr(X=m,Y>m) \\ &= \int_m^\infty f_{X,Y}(m,t)dt \end{align}$

\begin{aligned} P r (X \geq Y, m Eu n (X, Y) = m) & = P r (X \geq m, Y = m) \\ = \int_{m}^{\infty} f_{X, Y} (t, m) d t \end{aligned}

$\begin{align} Pr(X\geq Y,min(X,Y)=m) &=Pr(X\geq m,Y=m) \\ &= \int_m^\infty f_{X,Y}(t,m)dt \end{align}$

Usando normalidade e a definição de probabilidade condicional, os integrandos podem ser reescritos como

f_{X, Y} (m, t) = f_{Y | X} (t) f_{X} (m) = \frac{1 1}{\sqrt{σ_{Y | X}}} ϕ (\frac{t - μ_{Y | X}}{\sqrt{σ_{Y | X}}}) \frac{1 1}{\sqrt{σ_{11}}} ϕ (\frac{m - μ_{1 1}}{\sqrt{σ_{11}}})

$f_{X,Y}(m,t) = f_{Y|X}(t)f_X(m) = \frac{1}{\sqrt{\sigma_{Y|X}}}\phi\left(\frac{t-\mu_{Y|X}}{\sqrt{\sigma_{Y|X}}}\right)\frac{1}{\sqrt{\sigma_{11}}}\phi\left(\frac{m-\mu_1}{\sqrt{\sigma_{11}}}\right)$

f_{X, Y} (t, m) = f_{X | Y} (t) f_{Y} (m) = \frac{1 1}{\sqrt{σ_{X | Y}}} ϕ (\frac{t - μ_{X | Y}}{\sqrt{σ_{X | Y}}}) \frac{1 1}{\sqrt{σ_{22}}} ϕ (\frac{m - μ_{2}}{\sqrt{σ_{22}}}) .

$f_{X,Y}(t,m) = f_{X|Y}(t)f_Y(m) = \frac{1}{\sqrt{\sigma_{X|Y}}}\phi\left(\frac{t-\mu_{X|Y}}{\sqrt{\sigma_{X|Y}}}\right)\frac{1}{\sqrt{\sigma_{22}}}\phi\left(\frac{m-\mu_2}{\sqrt{\sigma_{22}}}\right).$

Onde

μ_{X | Y} = μ_{1 1} + \frac{σ_{12}}{σ_{22}} (m - μ_{2}),

$\mu_{X|Y} = \mu_1 + \frac{\sigma_{12}}{\sigma_{22}}(m-\mu_2),$

μ_{Y | X} = μ_{2} + \frac{σ_{12}}{σ_{11}} (m - μ_{1 1}),

$\mu_{Y|X} = \mu_2 + \frac{\sigma_{12}}{\sigma_{11}}(m-\mu_1),$

σ_{X | Y} = (1 1 - \frac{σ_{12}^{2}}{σ_{11} σ_{22}}) σ_{11}

$\sigma_{X|Y} = \left(1-\frac{\sigma_{12}^2}{\sigma_{11}\sigma_{22}}\right)\sigma_{11}$

σ_{Y | X} = (1 1 - \frac{σ_{12}^{2}}{σ_{11} σ_{22}}) σ_{22} .

$\sigma_{Y|X} = \left(1-\frac{\sigma_{12}^2}{\sigma_{11}\sigma_{22}}\right)\sigma_{22}.$

portanto

P r (X < Y | m i n (X, Y) = m) = \frac{(1 - Φ (\frac{m - μ_{Y | X}}{\sqrt{σ_{Y | X}}})) \frac{1}{\sqrt{σ_{11}}} ϕ (\frac{m - μ_{1}}{\sqrt{σ_{11}}})}{(1 - Φ (\frac{m - μ_{Y | X}}{\sqrt{σ_{Y | X}}})) \frac{1}{\sqrt{σ_{11}}} ϕ (\frac{m - μ_{1}}{\sqrt{σ_{11}}}) + (1 - Φ (\frac{m - μ_{X | Y}}{\sqrt{σ_{X | Y}}})) \frac{1}{\sqrt{σ_{22}}} ϕ (\frac{m - μ_{2}}{\sqrt{σ_{22}}})} .

$\begin{equation} Pr(X<Y|min(X,Y) = m) = \frac{\left(1-\Phi\left(\frac{m-\mu_{Y|X}}{\sqrt{\sigma_{Y|X}}}\right)\right)\frac{1}{\sqrt{\sigma_{11}}}\phi\left(\frac{m-\mu_1}{\sqrt{\sigma_{11}}}\right)}{\left(1-\Phi\left(\frac{m-\mu_{Y|X}}{\sqrt{\sigma_{Y|X}}}\right)\right)\frac{1}{\sqrt{\sigma_{11}}}\phi\left(\frac{m-\mu_1}{\sqrt{\sigma_{11}}}\right)+\left(1-\Phi\left(\frac{m-\mu_{X|Y}}{\sqrt{\sigma_{X|Y}}}\right)\right)\frac{1}{\sqrt{\sigma_{22}}}\phi\left(\frac{m-\mu_2}{\sqrt{\sigma_{22}}}\right)}. \end{equation}$

Este formulário final é muito semelhante ao resultado que o @olooney chegou. A diferença é que suas probabilidades não são ponderadas pelas densidades normais.

Um script R para verificação numérica pode ser encontrado aqui

— Mike
fonte