Na modelagem de equações estruturais com variáveis latentes (SEM), uma formulação de modelo comum é "Múltiplo Indicador, Causa Múltipla" (MIMIC), em que uma variável latente é causada por algumas variáveis e refletida por outras. Aqui está um exemplo simples:

Essencialmente, f1é um resultado de regressão para x1, x2e x3, e y1, y2e y3são indicadores de medição para f1.
Pode-se também definir uma variável latente composta, em que a variável latente equivale basicamente a uma combinação ponderada de suas variáveis constituintes.
Aqui está minha pergunta: existe uma diferença entre definir f1como resultado de regressão e defini-lo como resultado composto em um modelo MIMIC?
Alguns testes usando lavaansoftware Rmostram que os coeficientes são idênticos:
library(lavaan)
# load/prep data
data <- read.table("http://www.statmodel.com/usersguide/chap5/ex5.8.dat")
names(data) <- c(paste("y", 1:6, sep=""), paste("x", 1:3, sep=""))
# model 1 - canonical mimic model (using the '~' regression operator)
model1 <- '
f1 =~ y1 + y2 + y3
f1 ~ x1 + x2 + x3
'
# model 2 - seemingly the same (using the '<~' composite operator)
model2 <- '
f1 =~ y1 + y2 + y3
f1 <~ x1 + x2 + x3
'
# run lavaan
fit1 <- sem(model1, data=data, std.lv=TRUE)
fit2 <- sem(model2, data=data, std.lv=TRUE)
# test equality - only the operators are different
all.equal(parameterEstimates(fit1), parameterEstimates(fit2))
[1] "Component “op”: 3 string mismatches"
Como esses dois modelos são matematicamente iguais? Meu entendimento é que as fórmulas de regressão em um SEM são fundamentalmente diferentes das fórmulas compostas, mas esse achado parece rejeitar essa idéia. Além disso, é fácil criar um modelo em que o ~operador não seja intercambiável com o <~operador (para usar lavaana sintaxe). Geralmente, usar um no lugar dos outros resulta em um problema de identificação do modelo, especialmente quando a variável latente é usada em uma fórmula diferente de regressão. Então, quando eles são intercambiáveis e quando não são?
O livro de Rex Kline (Princípios e Práticas de Modelagem de Equações Estruturais) tende a falar sobre modelos MIMIC com a terminologia de compósitos, mas Yves Rosseel, autor lavaan, usa explicitamente o operador de regressão em todos os exemplos MIMIC que eu já vi.
Alguém pode esclarecer esse problema?
f1 ~ x1 + x2 + x3, mas pode terf1 <~ x1 + x2 + x3?