Na modelagem de equações estruturais com variáveis latentes (SEM), uma formulação de modelo comum é "Múltiplo Indicador, Causa Múltipla" (MIMIC), em que uma variável latente é causada por algumas variáveis e refletida por outras. Aqui está um exemplo simples:
Essencialmente, f1
é um resultado de regressão para x1
, x2
e x3
, e y1
, y2
e y3
são indicadores de medição para f1
.
Pode-se também definir uma variável latente composta, em que a variável latente equivale basicamente a uma combinação ponderada de suas variáveis constituintes.
Aqui está minha pergunta: existe uma diferença entre definir f1
como resultado de regressão e defini-lo como resultado composto em um modelo MIMIC?
Alguns testes usando lavaan
software R
mostram que os coeficientes são idênticos:
library(lavaan)
# load/prep data
data <- read.table("http://www.statmodel.com/usersguide/chap5/ex5.8.dat")
names(data) <- c(paste("y", 1:6, sep=""), paste("x", 1:3, sep=""))
# model 1 - canonical mimic model (using the '~' regression operator)
model1 <- '
f1 =~ y1 + y2 + y3
f1 ~ x1 + x2 + x3
'
# model 2 - seemingly the same (using the '<~' composite operator)
model2 <- '
f1 =~ y1 + y2 + y3
f1 <~ x1 + x2 + x3
'
# run lavaan
fit1 <- sem(model1, data=data, std.lv=TRUE)
fit2 <- sem(model2, data=data, std.lv=TRUE)
# test equality - only the operators are different
all.equal(parameterEstimates(fit1), parameterEstimates(fit2))
[1] "Component “op”: 3 string mismatches"
Como esses dois modelos são matematicamente iguais? Meu entendimento é que as fórmulas de regressão em um SEM são fundamentalmente diferentes das fórmulas compostas, mas esse achado parece rejeitar essa idéia. Além disso, é fácil criar um modelo em que o ~
operador não seja intercambiável com o <~
operador (para usar lavaan
a sintaxe). Geralmente, usar um no lugar dos outros resulta em um problema de identificação do modelo, especialmente quando a variável latente é usada em uma fórmula diferente de regressão. Então, quando eles são intercambiáveis e quando não são?
O livro de Rex Kline (Princípios e Práticas de Modelagem de Equações Estruturais) tende a falar sobre modelos MIMIC com a terminologia de compósitos, mas Yves Rosseel, autor lavaan
, usa explicitamente o operador de regressão em todos os exemplos MIMIC que eu já vi.
Alguém pode esclarecer esse problema?
f1 ~ x1 + x2 + x3
, mas pode terf1 <~ x1 + x2 + x3
?