Diferentemente da análise de componentes principais, as soluções para os modelos de análise fatorial não são necessariamente aninhadas. Ou seja, as cargas (por exemplo) para o primeiro fator não serão necessariamente idênticas quando apenas o primeiro fator for extraído versus quando os dois primeiros fatores forem.
Com isso em mente, considere um caso em que você tenha um conjunto de variáveis manifestas altamente correlacionadas e (pelo conhecimento teórico de seu conteúdo) deva ser conduzido por um único fator. Imagine que as análises fatoriais exploratórias (por qualquer métrica que você preferir: análise paralela, scree plot, valores de eigen> 1, etc.) sugerem fortemente que existem fatores: um fator primário grande e um fator secundário pequeno. Você está interessado em usar as variáveis manifestas e a solução fatorial para estimar (ou seja, obter pontuações fatoriais) os valores dos participantes para o primeiro fator. Nesse cenário, seria melhor:
- Ajuste um modelo de fator para extrair apenas fator e obter pontuações de fator (etc.) ou
- encaixar um modelo de fator para extrair os dois fatores, obter pontuações dos fatores, mas jogar fora / ignorar as pontuações do segundo fator?
Para qual for a melhor prática, por quê? Existe alguma pesquisa sobre esse assunto?
Is is always better to extract more factors when they exist?
não é muito claro. É sempre melhor extrair o maior número possível. O ajuste insuficiente ou excessivo distorce a estrutura latente "verdadeira" devido à natureza multivariada e não aninhada da análise mencionada por você. O problema é que não sabemos exatamente quantos fatores existem em nossos dados. E se esses dados têm tantos quantos a população possui.