A análise fatorial exploratória (AFE) é apropriada (psicometricamente e de outra forma) para examinar em que medida se pode explicar as correlações entre vários itens, inferindo a influência comum de um fator não medido (ou seja, latente). Se esse não for seu objetivo específico, considere análises alternativas, por exemplo:
- Modelagem linear geral (por exemplo, regressão múltipla, correlação canônica ou (M) AN (C) OVA)
- Análise fatorial confirmatória (CFA) ou análise latente de características / classes / perfis
- Modelagem de equações estruturais (SEM) / mínimos quadrados parciais
A dimensionalidade é o primeiro problema que o EFA pode resolver. Você pode examinar os autovalores da matriz de covariância (como produzindo um gráfico de scree via EFA) e conduzir uma análise paralela para resolver a dimensionalidade de suas medidas. (Consulte também alguns bons conselhos e sugestões alternativas de William Revelle .) Você deve fazer isso com cuidado antes de extrair um número limitado de fatores e rotacioná-los no EFA ou antes de ajustar um modelo com um número específico de fatores latentes usando CFA, SEM ou o gosto. Se uma análise paralela indicar multidimensionalidade, mas seu (primeiro) fator geral supera amplamente todos os outros (ou seja, tem de longe o maior valor próprio / explica a maioria das variações em suas medidas), considere a análise bifatorial (Gibbons & Hedeker, 1992;Reise, Moore e Haviland, 2010 ) .
Muitos problemas surgem na EFA e na modelagem de fatores latentes das classificações da escala Likert. As escalas Likert produzem dados ordinais (isto é, categóricos, politômicos, ordenados), não dados contínuos. A análise fatorial geralmente assume que qualquer entrada de dados brutos é contínua, e as pessoas geralmente realizam análises fatoriais de matrizes de correlações produto-momento da Pearson, que são apropriadas apenas para dados contínuos. Aqui está uma citação de Reise e colegas (2010) :
Técnicas comuns de análise fatorial confirmatória não se aplicam a dados dicotômicos ou politômicos (Byrne, 2006) . Em vez disso, são necessários procedimentos especiais de estimativa (Wirth & Edwards, 2007) . Basicamente, existem três opções para trabalhar com dados de resposta de itens politômicos. O primeiro é calcular uma matriz policórica e, em seguida, aplicar métodos de análise fatorial padrão (ver Knol & Berger, 1991) . Uma segunda opção é usar a análise fatorial de itens com informações completas (Gibbons & Hedeker, 1992) . O terceiro é usar procedimentos limitados de estimativa de informações projetados especificamente para dados ordenados, como mínimos quadrados ponderados com ajuste de média e variância (MPLUS; Muthén & Muthén, 2009) .
Eu recomendaria combinar a primeira e a terceira abordagens (ou seja, usar estimativa de mínimos quadrados ponderada na diagonal em uma matriz de correlação policórica), com base na discussão de Wang e Cunningham (2005) sobre os problemas com alternativas típicas:
Quando a análise fatorial confirmatória foi conduzida com dados ordinais não normais, usando máxima verossimilhança e com base nas correlações produto-momento de Pearson, as estimativas de parâmetros descendentes produzidas neste estudo foram consistentes com os achados de Olsson (1979) . Em outras palavras, a magnitude da não normalidade nas variáveis ordinais observadas é um dos principais determinantes da precisão das estimativas de parâmetros.
Os resultados também corroboram os achados de Babakus, et al. (1987) . Quando a estimativa da máxima verossimilhança é usada com uma matriz de entrada de correlação policórica nas análises fatoriais confirmatórias, as soluções tendem a resultar em valores qui-quadrado inaceitáveis e, portanto, significativos, juntamente com estatísticas de ajuste inadequadas.
Resta a questão de saber se os pesquisadores devem usar estimadores de mínimos quadrados ponderados ou diagonalmente ponderados na estimativa de modelos de equações estruturais com dados categóricos não normais. Nem a estimativa de mínimos quadrados ponderados nem a estimativa de mínimos quadrados ponderados na diagonal fazem suposições sobre a natureza da distribuição das variáveis e ambos os métodos produzem resultados assintoticamente válidos. No entanto, como a estimativa dos mínimos quadrados ponderados é baseada em momentos de quarta ordem, essa abordagem frequentemente leva a problemas práticos e é muito exigida em termos computacionais. Isso significa que a estimativa de mínimos quadrados ponderados pode não ter robustez quando usada para avaliar modelos de médio, ou seja, com 10 indicadores, para tamanho grande e tamanho de amostra pequeno a moderado.
Não está claro para mim se a mesma preocupação com a estimativa ponderada de mínimos quadrados se aplica à estimativa DWLS; independentemente, os autores recomendam esse estimador. Caso você ainda não possua os meios:
- R (R Core Team, 2012) é gratuito. Você precisará de uma versão antiga (por exemplo,
2.15.2
) para estes pacotes:
- O
psych
pacote (Revelle, 2013) contém a polychoric
função
- A
fa.parallel
função pode ajudar a identificar o número de fatores a serem extraídos.
- O
lavaan
pacote (Rosseel, 2012) oferece estimativa DWLS para análise de variáveis latentes.
- O
semTools
pacote contém os efaUnrotate
, orthRotate
e oblqRotate
funções.
- O
mirt
pacote (Chalmers, 2012) oferece alternativas promissoras usando a teoria da resposta ao item.
Imagino que o Mplus (Muthén & Muthén, 1998-2011) também funcione, mas a versão demo gratuita não acomoda mais de seis medições e a versão licenciada não é barata. Pode valer a pena se você puder pagar; as pessoas gostam Mplus , e os Muthéns' serviço ao cliente via seus fóruns é incrível!
Como mencionado acima, a estimativa do DWLS supera o problema das violações da suposição de normalidade (univariadas e multivariadas), que é um problema muito comum e quase onipresente nos dados de classificação da escala Likert. No entanto, não é necessariamente um problema pragmático conseqüente; a maioria dos métodos não é muito sensível a (fortemente influenciada por) pequenas violações (cf. O teste de normalidade é 'essencialmente inútil'? ). A resposta da @ chl a essa pergunta levanta pontos e sugestões mais importantes e excelentes, também com relação a problemas com estilo de resposta extremo; definitivamente um problema com as classificações na escala Likert e outros dados subjetivos.
Referências
· Babakus, E., Ferguson, JCE, & Jöreskog, KG (1987). A sensibilidade da análise fatorial confirmatória de máxima verossimilhança a violações da escala de medição e premissas distributivas. Journal of Marketing Research, 24 , 222-228.
· Byrne, BM (2006). Modelagem de Equações Estruturais com EQS. Mahwah, NJ: Lawrence Erlbaum.
· Chalmers, RP (2012). mirt: um pacote de teoria multidimensional de resposta a itens para o ambiente R. Journal of Statistical Software, 48 (6), 1–29. Recuperado em http://www.jstatsoft.org/v48/i06/ .
· Gibbons, RD, & Hedeker, DR (1992). Análise bi-fator de item com informações completas.
Psychometrika, 57 , 423-436.
· Knol, DL, e Berger, MPF (1991). Comparação empírica entre análise fatorial e modelos multidimensionais de resposta a itens. Pesquisa Comportamental Multivariada, 26 , 457–477.
· Muthén, LK e Muthén, BO (1998-2011). Guia do usuário do Mplus (6ª ed.). Los Angeles, CA: Muthén e Muthén.
· Muthén, LK e Muthén, BO (2009). Mplus (versão 4.00). [Software de computador]. Los Angeles, CA: Autor. URL: http://www.statmodel.com .
· Olsson, U. (1979). Estimativas de máxima verossimilhança para o coeficiente de correlação policórica. Psychometrika, 44 , 443-460.
·R Equipe principal. (2012). R: Uma linguagem e ambiente para computação estatística. Fundação R para Computação Estatística, Viena, Áustria. ISBN 3-900051-07-0, URL: http://www.R-project.org/ .
· Reise, SP, Moore, TM e Haviland, MG (2010). Modelos e rotações bifatoriais: explorando até que ponto os dados multidimensionais produzem pontuações unívocas na escala. Journal of Personality Assessment, 92 (6), 544–559. Recuperado em http://www.ncbi.nlm.nih.gov/pmc/articles/PMC2981404/ .
· Revelle, W. (2013). psych: Procedimentos para Personalidade e Pesquisa Psicológica. Universidade Northwestern, Evanston, Illinois, EUA. Recuperado em http://CRAN.R-project.org/package=psych . Versão = 1.3.2.
· Rosseel, Y. (2012). lavaan: Um pacote R para modelagem de equações estruturais. Journal of Statistical Software, 48 (2), 1–36. Recuperado em http://www.jstatsoft.org/v48/i02/ .
· Wang, WC, & Cunningham, EG (2005). Comparação de métodos alternativos de estimativa em análises fatoriais confirmatórias do General Health Questionnaire. Relatórios Psicológicos, 97 , 3-10.
· Wirth, RJ, e Edwards, MC (2007). Análise fatorial de item: abordagens atuais e orientações futuras. Métodos psicológicos, 12 , 58-79. Recuperado em http://www.ncbi.nlm.nih.gov/pmc/articles/PMC3162326/ .