Essa resposta discutirá possíveis modelos a partir de uma perspectiva de medição , na qual é dado um conjunto de variáveis ou medidas observadas (manifestas) inter-relacionadas, cuja variação compartilhada é assumida para medir um construto bem identificado, mas não diretamente observável (geralmente, em um reflexo). maneira), que será considerada uma variável latente . Se você não estiver familiarizado com o modelo de medição de características latentes, recomendo os dois artigos a seguir: O ataque dos psicométricos , de Denny Borsbooom, e Modelagem de variáveis latentes: uma pesquisa , de Anders Skrondal e Sophia Rabe-Hesketh. Primeiro farei uma pequena digressão com indicadores binários antes de lidar com itens com várias categorias de resposta.
Uma maneira de transformar dados do nível ordinal em escala de intervalo é usar algum tipo de modelo de resposta ao item . Um exemplo bem conhecido é o modelo de Rasch , que amplia a idéia do modelo de teste paralelo da teoria clássica de teste para lidar com itens com pontuação bináriaatravés de um modelo linear generalizado (com link logit) de efeito misto (em algumas implementações de software 'modernas'), em que a probabilidade de endossar um determinado item é uma função da 'dificuldade do item' e da 'capacidade da pessoa' (supondo que não haja interação entre a localização da pessoa na característica latente que está sendo medida e a localização do item na mesma escala de logit - que pode ser capturada por meio de um parâmetro adicional de discriminação de item ou interação com características específicas do indivíduo - que é chamada de funcionamento diferencial do item) O construto subjacente é assumido como unidimensional, e a lógica do modelo Rasch é justamente que o respondente possui uma certa 'quantidade do construto' - vamos falar sobre a responsabilidade do sujeito (sua 'habilidade') e chamá-loθθ
N= 766α = 0,971[ 0,967 ; 0,975 ]) Inicialmente, foram propostas cinco categorias de resposta (1 = 'Nunca', 2 = 'Raramente', 3 = 'Às vezes', 4 = 'Frequentemente' e 5 = 'Sempre') para cada item. Consideraremos aqui apenas respostas com pontuação binária.
(Aqui, as respostas aos itens do tipo Likert foram recodificadas como respostas binárias (1/2 = 0, 3-5 = 1), e consideramos que cada item é igualmente discriminativo entre os indivíduos, daí o paralelismo entre as inclinações da curva do item (Rasch modelo).)
x
Para itens politômicos com categorias ordenadas, há várias opções: o modelo de crédito parcial , o modelo em escala de classificação ou o modelo de resposta graduada , para citar apenas alguns que são usados principalmente na pesquisa aplicada. Os dois primeiros pertencem à chamada "família Rasch" dos modelos de TRI e compartilham as seguintes propriedades: (a) monotonicidade da função de probabilidade de resposta (curva de resposta item / categoria), (b) suficiência da pontuação individual total (com latência latente) parâmetro considerado fixo), (c) independência local, o que significa que as respostas aos itens são independentes, dependentes da característica latente; e (d) ausência de funcionamento diferencial dos itens significando que, dependendo da característica latente, as respostas são independentes das variáveis específicas individuais do indivíduo (por exemplo, sexo, idade, etnia, SES).
Estendendo o exemplo anterior ao caso em que as cinco categorias de resposta são efetivamente consideradas, um paciente terá uma probabilidade maior de escolher a categoria de resposta 3 a 5, em comparação com alguém da amostra da população em geral, sem antecedentes de transtornos relacionados à ansiedade. Comparados à modelagem do item dicotômico descrito acima, esses modelos consideram cumulativo (por exemplo, chances de resposta 3 x 2 ou menos) ou limiar de categoria adjacente (chances de resposta 3 x 2), o que também é discutido em Categorias de Agresti Análise de dados(capítulo 12) A principal diferença entre os modelos mencionados acima está na maneira como são tratadas as transições de uma categoria de resposta para a outra: o modelo de crédito parcial não pressupõe que a diferença entre um determinado local de limiar e a média dos locais de limiar na característica latente seja igual ou uniforme entre itens, ao contrário do modelo em escala de classificação. Outra diferença sutil entre esses modelos é que alguns deles (como resposta graduada irrestrita ou modelo de crédito parcial) permitem parâmetros de discriminação desiguais entre os itens. Consulte Aplicando a modelagem da teoria da resposta ao item para avaliar as propriedades do item e da escala do questionário , de Reeve e Fayers, ou A base da teoria da resposta ao item , de Frank B. Baker, para obter mais detalhes.
Como no caso anterior discutimos a interpretação das curvas de probabilidade de respostas para itens com pontuação dicotômica, vejamos as curvas de resposta ao item derivadas de um modelo de resposta graduada, destacando os mesmos itens de destino:
(Modelo de resposta graduada sem restrições, permitindo discriminação desigual entre os itens.)
Aqui, as seguintes observações merecem consideração:
- [ 2 ; 2,5 ]
- Há uma mudança geral, da esquerda para a direita, entre o item que avalia a qualidade do sono e os que avaliam condições mais graves, embora os distúrbios do sono não sejam incomuns. Isso é esperado: afinal de contas, mesmo as pessoas da população em geral podem ter alguma dificuldade em adormecer, independentemente de seu estado de saúde, e as pessoas gravemente deprimidas ou ansiosas provavelmente exibem esses problemas. No entanto, é improvável que 'pessoas normais' (se isso tiver algum significado) mostre alguns sinais de transtorno do pânico (a probabilidade de escolherem a categoria de resposta mais alta é zero para pessoas localizadas na faixa intermediária ou mais da característica latente, [ 0; 1]).
θ
Além de serem considerados modelos de medição verdadeiramente , o que torna os modelos Rasch atraentes é que as pontuações de soma, como estatística suficiente , podem ser usadas como substitutas das pontuações latentes. Além disso, a propriedade suficiência implica prontamente a separabilidade dos parâmetros do modelo (pessoas e itens) (no caso de itens politômicos, não se deve esquecer que tudo se aplica no nível da categoria de resposta ao item), portanto, aditividade conjunta.
Uma boa revisão da hierarquia do modelo IRT, com a implementação R, está disponível no artigo de Mair e Hatzinger publicado no Journal of Statistical Software : Extensão Rasch Modeling: O Pacote de ERM para a Aplicação de IRT Models em R . Outros modelos incluem modelos log-lineares , modelo não paramétrico, como o modelo Mokken , ou modelos gráficos .
Além do R, não conheço as implementações do Excel, mas vários pacotes estatísticos foram propostos neste segmento: Como começar a aplicar a teoria da resposta ao item e qual software usar?
Por fim, se você deseja estudar as relações entre um conjunto de itens e uma variável de resposta sem recorrer a um modelo de medição, alguma forma de quantização de variáveis por meio do dimensionamento ideal também pode ser interessante. Além das implementações de R discutidas nesses threads, as soluções SPSS também foram propostas em threads relacionados .
Referências
- Pilkonis, P., Choi, S., Reise, S., Stover, A. e Riley, W. et al. (2011). Bancos de itens para medir o estresse emocional do sistema de informações de medição de resultados relatados pelo paciente (PROMIS): Depressão, ansiedade e raiva . Assessment , 18 (3), 263–283.
- Choi, S., Gibbons, L. e Crane, P. (2011). lordif: Um pacote R para detectar o funcionamento diferencial de itens usando regressão logística ordinal híbrida iterativa / teoria de resposta a itens e simulações de monte carlo . Journal of Statistical Software , 39 (8).