Estou interessado em encontrar um procedimento para simular dados que sejam consistentes com um modelo de mediação especificado. De acordo com a estrutura geral do modelo de equações estruturais lineares para testar modelos de mediação, primeiro descritos por Barron e Kenny (1986) e descritos em outros lugares como Judd, Yzerbyt e Muller (2013) , modelos de mediação para o resultado , mediador \ newcommand {\ med} {\ rm med} \ med e o preditor X e são governados pelas três equações de regressão a seguir: \ begin {align} Y & = b_ {11} + b_ {12} X + e_1 \ tag {1} \\ \ med & = b_ {21} + b_ {22} X + e_2 \ tag {2} \\ Y & = b_ {31} + b_ {32} X + b_ {32} \ med + e_3 \ tag {3} \ end {alinhar}
Até agora, tentei simular valores de e que são consistentes com os valores dos vários coeficientes de regressão usando rnorm
in R
, como o código abaixo:
x <- rep(c(-.5, .5), 50)
med <- 4 + .7 * x + rnorm(100, sd = 1)
# Check the relationship between x and med
mod <- lm(med ~ x)
summary(mod)
y <- 2.5 + 0 * x + .4 * med + rnorm(100, sd = 1)
# Check the relationships between x, med, and y
mod <- lm(y ~ x + med)
summary(mod)
# Check the relationship between x and y -- not present
mod <- lm(y ~ x)
summary(mod)
No entanto, parece que gerar seqüencialmente e usando as equações 2 e 3 não é suficiente, uma vez que não tenho relação entre e na equação de regressão 1 (que modela uma relação bivariada simples entre e ) usando essa abordagem . Isso é importante porque uma definição do efeito indireto (mediação) é , como descrevi acima.
Alguém pode me ajudar a encontrar um procedimento em R para gerar variáveis , e que atendam às restrições definidas por meio das equações 1, 2 e 3?