Diferença de duas variáveis aleatórias lognormal iid

Seja e dois locais onde . Gostaria de saber a distribuição para . $X_1$ $X_2$ $\log(X_1),\log(X_2) \sim N(\mu,\sigma)$ $X_1 - X_2$

O melhor que posso fazer é pegar a série Taylor de ambos e entender que a diferença é a soma da diferença entre dois rv normais e dois qui-quadrado, além do restante da diferença entre os demais termos. Existe uma maneira mais direta de obter a distribuição da diferença entre 2 rv log-id normais?

— frayedchef
fonte

Aqui está um artigo relevante. Você encontrará mais artigos pesquisando no Google! papers.ssrn.com/sol3/papers.cfm?abstract_id=2064829

— kjetil b halvorsen

Dei uma olhada superficial naquele artigo e não parece responder à minha pergunta de maneira satisfatória. Eles parecem estar preocupados com aproximações numéricas para o problema mais difícil de encontrar a distribuição para a soma / diferença entre rvs lognormais correlacionados . Eu esperava que houvesse uma resposta mais simples para o caso independente.

— Frayedchef 18/05/19

Pode ser uma resposta mais simples no caso independente, mas não simples! O caso lognormal é um caso difícil conhecido como --- a função geradora de momento da distribuição lognormal não existe --- ou seja, não converge para um intervalo aberto que contém zero. Portanto, você não encontrará uma solução fácil.

— Kjetil b halvorsen

Entendo ... Então, a abordagem que descrevi acima seria razoável? (isto é, se

Y_{i} = \log (X_{i})

$Y_i = \log(X_i)$

Sabemos alguma coisa sobre os termos de ordem superior ou como vinculá-los?

X_{1} - X_{2} \approx (Y_{1} - Y_{2}) + (Y_{1}^{2} - Y_{2}^{2}) / 2 + . . .

$X_1 - X_2 \approx (Y_1 - Y_2) + (Y_1^2 - Y_2^2)/2 + {} ...$

— Freddchef 18/05/19

Para ilustrar a dificuldade --- o logf normal mgf é definido apenas em

. Para aproximar a distribuição das diferenças pelos métodos do ponto de sela, precisamos (K = cumulante de gf)

, e . essa soma só é definida em um só ponto, zero, de modo, não parece ao trabalho soma ou média seria mais simples.!

(- \infty, 0]

$(-\infty,0]$

K (s) + K (- s)

$K(s)+K(-s)$

— b Kjetil Halvorsen

Respostas:

Este é um problema difícil. Pensei primeiro em usar (alguma aproximação) a função geradora de momento da distribuição lognormal. Isso não funciona, como explicarei. Mas primeiro alguma notação:

Deixe ser a densidade normal padrão e a correspondente função de distribuição cumulativa. Nós só irá analisar a distribuição log-normal caso , que tem a função de densidade de $\phi$ $\Phi$ $lnN(0,1)$ e função de distribuição cumulativa Suponha queesejam variáveis aleatórias independentes com a distribuição lognormal acima. Estamos interessados na distribuição de, que é uma distribuição simétrica com média zero. Vamosser a função geradora momento de. É definido apenas para

f (x) = \frac{1}{\sqrt{2 π} x} e^{- \frac{1}{2} (\ln x)^{2}}

$f(x)=\frac1{\sqrt{2\pi}x} e^{-\frac12 (\ln x)^2}$

F (x) = Φ (em x)

$F(x) =\Phi(\ln x)$

X

$X$

Y

$Y$

D = X - Y

$D=X-Y$

M (t) = E e^{t X}

$M(t) = \DeclareMathOperator{\E}{E} \E e^{tX}$

X

$X$

, portanto não definido em um intervalo aberto contendo zero. A função geradora de momentos para

Portanto, a função geradora de momento para

é definida apenas para

t \in (- \infty, 0]

$t\in (-\infty,0]$

D

$D$

M_{D} (t) = E e^{t (X - Y)} = E e^{t X} E e^{- t Y} = M (t) M (- t)

$M_D(t)=\E e^{t(X-Y)}= \E e^{tX} \E e^{-tY}= M(t)M(-t)$

D

$D$

t = 0

$t=0$ , então não é muito útil.

$D$ $t\ge 0$

\begin{aligned} P (D \leq t) & = P (X - Y \leq t) \\ = \int_{0 0}^{\infty} P (X - y \leq t | Y = y) f (y) d y \\ = \int_{0 0}^{\infty} P (X \leq t + y) f (y) d y \\ = \int_{0 0}^{\infty} F (t + y) f (y) d y \end{aligned}

$\begin{align} P(D \le t) &= P(X-Y\le t) \\ &= \int_0^\infty P(X-y\le t | Y=y) f(y) \; dy \\ &= \int_0^\infty P(X\le t+y) f(y) \; dy \\ &= \int_0^\infty F(t+y) f(y) \; dy \end{align}$

t < 0

$t<0$

P (D \leq t) = 1 - P (D \leq | t |)

$P(D\le t)=1-P(D\le |t|)$

Esta expressão pode ser usada para integração numérica ou como base para simulação. Primeiro um teste:

 integrate(function(y) plnorm(y)*dlnorm(y), lower=0,  upper=+Inf)
  0.5 with absolute error < 2.3e-06

o que é claramente correto. Vamos encerrar isso dentro de uma função:

pDIFF  <-  function(t) {
    d  <-  t
    for (tt in seq(along=t)) {
        if (t[tt] >= 0.0) d[tt] <- integrate(function(y) plnorm(y+t[tt])*dlnorm(y),
                                         lower=0.0,  upper=+Inf)$value else
                          d[tt] <- 1-integrate(function(y) plnorm(y+abs(t[tt]))*dlnorm(y),
                                         lower=0.0, upper=+Inf)$value
    }
    return(d)
}

> plot(pDIFF,  from=-5,  to=5)

que dá:

Então podemos encontrar a função densidade, diferenciando-se sob o sinal integral, obtendo

dDIFF  <-  function(t) {
       d  <- t; t<- abs(t)
       for (tt in seq(along=t)) {
           d[tt]  <-  integrate(function(y) dlnorm(y+t[tt])*dlnorm(y),
                                lower=0.0,  upper=+Inf)$value
       }
       return(d)
}

que podemos testar:

> integrate(dDIFF,  lower=-Inf,  upper=+Inf)
0.9999999 with absolute error < 1.3e-05

E plotando a densidade que obtemos:

plot(dDIFF,  from=-5,  to=5)

Também tentei obter alguma aproximação analítica, mas até agora não obtive sucesso, não é um problema fácil. Mas a integração numérica como acima, programada em R, é muito rápida no hardware moderno, por isso é uma boa alternativa que provavelmente deve ser usada muito mais.

— kjetil b halvorsen
fonte

$X$ $Y$

\begin{aligned} Pr (\frac{X}{Y} \leq t) & = Pr (registro (\frac{X}{Y}) \leq registro (t)) \\ = Pr (registro (X) - registro (Y) \leq registro (t)) \\ \sim N (0 0, 2 σ^{2}) \end{aligned}

$\begin{align} \Pr\left(\frac{X}{Y} \leq t\right) &= \Pr\left(\log\left(\frac{X}{Y}\right) \leq \log(t) \right) \\ &= \Pr(\log(X) - \log(Y) \leq \log(t)) \\ &\sim \mathcal{N}(0, 2 \sigma^2) \end{align}$

Dependendo da sua aplicação, isso pode atender às suas necessidades.

— Vincent Traag
fonte

Mas não estamos olhando para XY em vez de log (X) - log (Y)?

— Sextus Empiricus

Sim, claro. Isso é apenas no caso de alguém estar interessado em saber como duas variáveis lognormais diferem uma da outra, sem que necessariamente seja uma diferença. É por isso que também digo que não responde à pergunta.

— Vincent Traag 03/02

Diferença de duas variáveis ​​aleatórias lognormal iid

Diferença de duas variáveis aleatórias lognormal iid