Problema: estou parametrizando distribuições para uso como prioros e dados em uma metanálise bayesiana. Os dados são fornecidos na literatura como estatística resumida, quase exclusivamente assumida como sendo normalmente distribuída (embora nenhuma das variáveis possa ser <0, algumas são proporções, outras são massa etc.).
Me deparei com dois casos para os quais não tenho solução. Às vezes, o parâmetro de interesse é o inverso dos dados ou a proporção de duas variáveis.
Exemplos:
- a proporção de duas variáveis normalmente distribuídas:
- dados: média e sd para porcentagem de nitrogênio e porcentagem de carbono
- parâmetro: proporção de carbono para nitrogênio.
- o inverso de uma variável normalmente distribuída:
- dados: massa / área
- parâmetro: área / massa
Minha abordagem atual é usar a simulação:
por exemplo, para um conjunto de dados percentuais de carbono e nitrogênio com médias: xbar.n, c, variação: se.n, ce tamanho da amostra: nn, nc:
set.seed(1)
per.c <- rnorm(100000, xbar.c, se.c*n.c) # percent C
per.n <- rnorm(100000, xbar.n, se.n*n.n) # percent N
Quero parametrizar ratio.cn = perc.c / perc.n
# parameter of interest
ratio.cn <- perc.c / perc.n
Em seguida, escolha as distribuições de melhor ajuste com intervalo para o meu
library(MASS)
dist.fig <- list()
for(dist.i in c('gamma', 'lognormal', 'weibull')) {
dist.fit[[dist.i]] <- fitdist(ratio.cn, dist.i)
}
Pergunta: Essa é uma abordagem válida? Existem outras / melhores abordagens?
Desde já, obrigado!
Atualização: a distribuição de Cauchy, que é definida como a razão de duas normais com , tem utilidade limitada, pois eu gostaria de estimar a variação. Talvez eu pudesse calcular a variação de uma simulação de n draws de um Cauchy?
Fiz encontrar os seguintes aproximações de forma fechada mas não testado para ver se eles dão os mesmos resultados ... Hayya et al, 1975 μ y : x = μ y / m u x + σ 2 x * μ y / μ 3 x + c o v ( x , y ) * σ 2 x * σ 2 y / μ 2 x σ 2 y
Hayya, J. e Armstrong, D. e Gressis, N., 1975. Uma nota sobre a razão de duas variáveis normalmente distribuídas. Ciência da Administração 21: 1338--1341