Qual é a diferença entre um fator MIMIC e um composto com indicadores (SEM)?

Na modelagem de equações estruturais com variáveis latentes (SEM), uma formulação de modelo comum é "Múltiplo Indicador, Causa Múltipla" (MIMIC), em que uma variável latente é causada por algumas variáveis e refletida por outras. Aqui está um exemplo simples:

Essencialmente, f1é um resultado de regressão para x1, x2e x3, e y1, y2e y3são indicadores de medição para f1.

Pode-se também definir uma variável latente composta, em que a variável latente equivale basicamente a uma combinação ponderada de suas variáveis constituintes.

Aqui está minha pergunta: existe uma diferença entre definir f1como resultado de regressão e defini-lo como resultado composto em um modelo MIMIC?

Alguns testes usando lavaansoftware Rmostram que os coeficientes são idênticos:

library(lavaan)

# load/prep data
data <- read.table("http://www.statmodel.com/usersguide/chap5/ex5.8.dat")
names(data) <- c(paste("y", 1:6, sep=""), paste("x", 1:3, sep=""))

# model 1 - canonical mimic model (using the '~' regression operator)
model1 <- '
    f1 =~ y1 + y2 + y3
    f1 ~ x1 + x2 + x3
'

# model 2 - seemingly the same (using the '<~' composite operator)
model2 <- '
    f1 =~ y1 + y2 + y3
    f1 <~ x1 + x2 + x3
'

# run lavaan
fit1 <- sem(model1, data=data, std.lv=TRUE)
fit2 <- sem(model2, data=data, std.lv=TRUE)

# test equality - only the operators are different
all.equal(parameterEstimates(fit1), parameterEstimates(fit2))
[1] "Component “op”: 3 string mismatches"

Como esses dois modelos são matematicamente iguais? Meu entendimento é que as fórmulas de regressão em um SEM são fundamentalmente diferentes das fórmulas compostas, mas esse achado parece rejeitar essa idéia. Além disso, é fácil criar um modelo em que o ~operador não seja intercambiável com o <~operador (para usar lavaana sintaxe). Geralmente, usar um no lugar dos outros resulta em um problema de identificação do modelo, especialmente quando a variável latente é usada em uma fórmula diferente de regressão. Então, quando eles são intercambiáveis e quando não são?

O livro de Rex Kline (Princípios e Práticas de Modelagem de Equações Estruturais) tende a falar sobre modelos MIMIC com a terminologia de compósitos, mas Yves Rosseel, autor lavaan, usa explicitamente o operador de regressão em todos os exemplos MIMIC que eu já vi.

Alguém pode esclarecer esse problema?

sem latent-variable lavaan

— dmp
fonte

Eles são do mesmo modelo.

É útil poder definir uma variável latente como um resultado composto, em que essa variável possui apenas indicadores compostos.

Se você não tem:

f1 =~ y1 + y2 + y3

Você não pode colocar:

f1 ~ x1 + x2 + x3

Mas você pode ter:

f1 <~ x1 + x2 + x3

— Jeremy Miles
fonte

Obrigado! Você poderia talvez esclarecer por que não pode ter f1 ~ x1 + x2 + x3, mas pode ter f1 <~ x1 + x2 + x3?

— dmp

Como na primeira instância, f1 ainda não é uma variável no modelo, porque é latente, você precisa defini-la.

— Jeremy Miles

Se você tivesse esse modelo, teria que usar um truque como f1 = ~ 0 * x1 para ter um var latente, que poderá usar em f ~ x1 + x2 + x3.

— Jeremy Miles