Estou desenvolvendo empiricamente um questionário e usarei números arbitrários neste exemplo para ilustrar. Para contextualizar, estou desenvolvendo um questionário psicológico destinado a avaliar padrões de pensamento comumente identificados em indivíduos com transtornos de ansiedade. Um item pode se parecer com " Preciso verificar o forno repetidamente, porque não tenho certeza se está desligado ".
Tenho 20 perguntas (Likert de 5 pontos) que podem ser compostas por um ou dois fatores (observe que, na realidade, tenho mais de 200 perguntas, compostas por 10 escalas, e cada escala pode ser composta por dois fatores). Estou disposto a apagar cerca de metade dos itens, deixando 10 perguntas sobre um dos dois fatores.
Estou familiarizado com a análise fatorial exploratória (AFE), consistência interna (alfa de Cronbach) e curvas de característica de item na teoria de resposta ao item (TRI). Eu posso ver como eu usaria qualquer um desses métodos para determinar quais itens são os "piores" em uma única escala. Compreendo que cada método também responda a perguntas diferentes, embora possam levar a resultados semelhantes e não tenho certeza de qual "pergunta" é mais importante.
Antes de começarmos, vamos ter certeza de que sei o que estou fazendo com cada um desses métodos individualmente.
Usando o EFA, eu identificaria o número de fatores e removeria os itens que carregam menos (digamos <0,30) em seus respectivos fatores ou que carregam substancialmente vários fatores.
Usando consistência interna, eu removia itens com o pior "alfa se o item for excluído". Eu poderia fazê-lo assumindo um fator na minha escala ou depois de um EFA inicial para identificar o número de fatores e, posteriormente, executar meu alfa para cada fator.
Usando o IRT, eu removia itens que não avaliam o fator de interesse nas opções de resposta (5 Likert). Eu estaria olhando as curvas características dos itens. Basicamente, eu estaria procurando uma linha em um ângulo de 45 graus, indo da opção 1 na escala Likert até 5 ao longo da pontuação latente. Eu poderia fazê-lo assumindo um fator ou depois de um
EFA inicial para identificar o número de fatores e, posteriormente, executar as curvas para cada fator.
Não tenho certeza de qual desses métodos usar para identificar melhor quais itens são os "piores". Eu uso o pior em um sentido amplo, de modo que o item seja prejudicial à medida, seja em termos de confiabilidade ou validade, os quais são igualmente importantes para mim. Presumivelmente, posso usá-los em conjunto, mas não sei ao certo como.
Se eu fosse em frente com o que sei agora e desse o meu melhor, faria o seguinte:
- Faça um EFA para identificar o número de fatores. Exclua também itens com cargas ruins em seus respectivos fatores, pois não quero itens com carga ruim, independentemente de como seriam em outras análises.
- Faça o IRT e remova também os itens defeituosos julgados por essa análise, se houver algum do EFA.
- Simplesmente relate o Alpha de Cronbach e não use essa métrica como um meio de excluir itens.
Qualquer orientação geral seria muito apreciada!
Aqui também está uma lista de perguntas específicas que você talvez possa responder:
Qual é a diferença prática entre remover itens com base em cargas fatoriais e remover itens com base no alfa de Chronbach (assumindo que você use o mesmo layout de fator para as duas análises)?
O que devo fazer primeiro? Supondo que eu pratico EFA e TRI com um fator e ambos identifiquem itens diferentes que devem ser removidos, que análise deve ter prioridade?
Não estou decidido a fazer todas essas análises, apesar de relatar o alfa de Chronbach independentemente. Eu sinto que fazer apenas IRT deixaria algo faltando, e da mesma forma apenas para EFA.