Recebi um conjunto de 20 itens Likert (variando de 1 a 5, tamanho da amostra n = 299) no campo da pesquisa organizacional. Os itens destinam-se a medir um conceito latente que é multidimensional, multifacetado e heterogêneo em sua própria natureza. O objetivo é criar uma (s) escala (s) que possam ser bem usadas para analisar diferentes organizações e serem usadas na regressão logística. Seguindo a associação americana de psicologia, uma escala deve ser (1) unidimensional, (2) confiável e (3) válida.
Portanto, decidimos selecionar quatro dimensões ou subescalas com 4/6/6/4 itens cada; com a hipótese de representar o conceito.
Os itens foram construídos usando a abordagem reflexiva (gerando muitos itens possíveis e excluindo iterativamente itens usando o alfa de cronbach e a representação conceitual (validade) em três grupos subsequentes).
Usando os dados disponíveis, uma análise fatorial explicativa paralela preliminar baseada em correlações policóricas e usando rotação varimax revelou que os itens carregam outros fatores além do esperado. Existem pelo menos 7 fatores latentes, em oposição a quatro fatores hipotéticos. A correlação média entre itens é bastante baixa (r = 0,15), embora positiva. O coeficiente cronbach-alfa também é muito baixo (0,4-0,5) para cada escala. Duvido que uma análise fatorial confirmatória produza um bom ajuste do modelo.
Se duas dimensões fossem descartadas, o alfa de cronbachs seria aceitável (0,76,0,7 com 10 itens por escala, que ainda poderia ser aumentado usando a versão ordinal do alfa de cronbachs), mas as próprias escalas ainda seriam multidimensionais!
Como sou iniciante em estatística e não tenho o conhecimento adequado, não sei como prosseguir. Como reluto em descartar a (s) escala (s) completamente e renunciar a uma abordagem apenas descritiva, tenho perguntas diferentes:
I) É errado usar escalas confiáveis, válidas, mas não unidimensionais?
II) Seria apropriado interpretar o conceito posteriormente como formativo e usar o teste tetrad de fuga para avaliar a especificação do modelo e usar mínimos quadrados parciais (PLS) para chegar a uma possível solução? Afinal, o conceito parece ser mais formativo do que reflexivo.
III) O uso dos modelos de resposta ao item (Rasch, GRM etc) seria de alguma utilidade? Como eu li, os modelos rasch, etc. também precisam da suposição de unidimensionalidade
IV) Seria apropriado usar os 7 fatores como novas "subescalas"? Apenas descarte a definição antiga e use uma nova com base em cargas fatoriais?
Eu apreciaria qualquer opinião sobre este :)
EDIT: Adicionado fator de cargas e correlações
> fa.res$fa
Factor Analysis using method = ml
Call: fa.poly(x = fl.omit, nfactors = 7, rotate = "oblimin", fm = "ml")
Cargas fatoriais calculadas a partir da matriz de padrão fatorial e matriz de intercorrelação fatorial, somente valores acima de 0,2 são exibidos