Como parametrizar a proporção de duas variáveis ​​normalmente distribuídas ou o inverso de uma?


12

Problema: estou parametrizando distribuições para uso como prioros e dados em uma metanálise bayesiana. Os dados são fornecidos na literatura como estatística resumida, quase exclusivamente assumida como sendo normalmente distribuída (embora nenhuma das variáveis ​​possa ser <0, algumas são proporções, outras são massa etc.).

Me deparei com dois casos para os quais não tenho solução. Às vezes, o parâmetro de interesse é o inverso dos dados ou a proporção de duas variáveis.

Exemplos:

  1. a proporção de duas variáveis ​​normalmente distribuídas:
    • dados: média e sd para porcentagem de nitrogênio e porcentagem de carbono
    • parâmetro: proporção de carbono para nitrogênio.
  2. o inverso de uma variável normalmente distribuída:
    • dados: massa / área
    • parâmetro: área / massa

Minha abordagem atual é usar a simulação:

por exemplo, para um conjunto de dados percentuais de carbono e nitrogênio com médias: xbar.n, c, variação: se.n, ce tamanho da amostra: nn, nc:

set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N

Quero parametrizar ratio.cn = perc.c / perc.n

# parameter of interest
ratio.cn <- perc.c / perc.n

Em seguida, escolha as distribuições de melhor ajuste com intervalo para o meu0

library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
    dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}

Pergunta: Essa é uma abordagem válida? Existem outras / melhores abordagens?

Desde já, obrigado!

Atualização: a distribuição de Cauchy, que é definida como a razão de duas normais com , tem utilidade limitada, pois eu gostaria de estimar a variação. Talvez eu pudesse calcular a variação de uma simulação de n draws de um Cauchy?μ=0

Fiz encontrar os seguintes aproximações de forma fechada mas não testado para ver se eles dão os mesmos resultados ... Hayya et al, 1975 μ y : x = μ y / m u x + σ 2 x * μ y / μ 3 x + c o v ( x , y ) * σ 2 x * σ 2 y / μ 2 x σ 2 y

μ^y:x=μy/mux+σx2μy/μx3+cov(x,y)σx2σy2/μx2
σ^y:x2=σx2×μy/mux4+σy2/mux22cov(x,y)σx2σy2/mux3

Hayya, J. e Armstrong, D. e Gressis, N., 1975. Uma nota sobre a razão de duas variáveis ​​normalmente distribuídas. Ciência da Administração 21: 1338--1341


devo postar a pergunta Atualização sobre o cálculo da variação em desenhos aleatórios do Cauchy como uma pergunta separada?
David LeBauer 15/10/10

david - como todas as suas variáveis ​​são positivas, por que você quer mexer com ? btw - em sua simulação, você parece estar gerando variáveis ​​per.c e per.n que são independentes. está correto - e se sim, é isso que você deseja? μ=0
Ronaf 18/10/10

μ

XYZ=XYxyp(x,y)dxdy
Royi

Respostas:


6

Você pode querer olhar para algumas das referências no artigo da Wikipedia sobre Distribuição de proporção . É possível que você encontre melhores aproximações ou distribuições para usar. Caso contrário, sua abordagem parecerá correta.

Atualização Acho que uma referência melhor pode ser:

Consulte as fórmulas 2-4 na página 195.

Atualização 2

Em sua pergunta atualizada sobre variação de um Cauchy - como John Cook apontou nos comentários, a variação não existe. Portanto, obter uma variação da amostra simplesmente não funcionará como um "estimador". De fato, você descobrirá que sua variação de amostra não converge e flutua bastante à medida que você continua colhendo amostras.


Obrigado pela referência, foi aí que encontrei a referência de Haaya 1975 e as equações na minha pergunta, embora eu apreciei a garantia de que as equações são apropriadas para o meu problema.
David LeBauer 15/10/10

Olhando rapidamente para Haaya, parece que eles estão preocupados em obter uma aproximação Normal para a razão e usar simulações para determinar quando isso se aplica (usando o coeficiente de variação, cv). O CV no seu caso atende aos critérios? Nesse caso, as aproximações se aplicam.
ars

1
@ David: use Marsaglia 1965 como atualizado na resposta.
quer

Nota: Marsaglia publicou uma atualização no JSS em 2004 .
David LeBauer

Não entendo por que a expectativa da relação não existe. E seX e Y normalmente são distribuídos em conjunto com média diferente de zero, então a média de Z=XY É dado por xyp(x,y)dxdy, o que estou perdendo?
Royi

0

Você não poderia assumir que y-1N(.,.) para o inverso de uma variável aleatória normal e faça o cálculo bayesiano necessário após identificar os parâmetros apropriados para a distribuição normal.

Minha sugestão abaixo para usar o Cauchy não funciona como apontado nos comentários de ars e John.

A proporção de duas variáveis ​​normalmente aleatórias segue a distribuição de Cauchy . Você pode usar essa idéia para identificar os parâmetros do cauchy que melhor se ajustam aos dados que você possui.


uma. Preciso estimar a variação e a variação da distribuição de Cauchy não está definida.
David LeBauer 15/10/10

b. Se eu entendi o seu segundo ponto, sim, eu poderia assumir que y-1 ~ N (mu, sigma), mas ainda preciso calcular mu e sigma a partir das estatísticas resumidas dadas para y; além disso, optei por não considerar distribuições com valores <0 para variáveis ​​definidas apenas> 0 (embora em muitos casos p (X <0 | X ~ N (mu, s)) -> 0)
David LeBauer

O Cauchy não aplica zero normais normais?
quer

@ars Você está correto. O cauchy então pode ser de uso limitado.

Ars: Sim, acredito que o resultado de Cauchy requer zero meios. Mas isso ainda significa que, pelo menos nesse caso especial, a variação que David está tentando estimar NÃO EXISTE.
John D. Cook
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.