Como transformar dados ordinais do questionário em dados de intervalo adequados?

Existem métodos simples de transformar dados de nível ordinal em nível de intervalo (assim como existem para fazê-lo ao contrário)? E performable no Excel ou SPSS?

Tendo os dados, digamos: 10 perguntas no nível ordinal (digamos, escala 0-5, onde 0 = "nada", 5 = "o tempo todo"), quero transformá-las para que possam ser tratadas como apropriadas dados em nível de intervalo para fins de teste paramétrico (distribuição normal, testes não paramétricos fora de questão).

Ficaria extremamente grato por respostas!

— Gil
fonte

Como alguém pode ter valores 6, 7, 8, 9, 10 na escala 0-5, ou sinto falta de algo?

— ttnphns

O que você quer dizer com simples? Converter variáveis categóricas em escalas métricas não é uma tarefa simples. Existem alguns modelos de variáveis latentes (como modelos de IRT) que, dadas certas suposições, permitem fazer isso. Outra maneira é o dimensionamento ideal. Mas, para isso, suponho que você esteja disposto a fazer coisas com R e mergulhe em algumas estatísticas avançadas, como modelos de variáveis latentes ou PCA não linear. Isso soa bem?

— Momo

Essa resposta discutirá possíveis modelos a partir de uma perspectiva de medição , na qual é dado um conjunto de variáveis ou medidas observadas (manifestas) inter-relacionadas, cuja variação compartilhada é assumida para medir um construto bem identificado, mas não diretamente observável (geralmente, em um reflexo). maneira), que será considerada uma variável latente . Se você não estiver familiarizado com o modelo de medição de características latentes, recomendo os dois artigos a seguir: O ataque dos psicométricos , de Denny Borsbooom, e Modelagem de variáveis latentes: uma pesquisa , de Anders Skrondal e Sophia Rabe-Hesketh. Primeiro farei uma pequena digressão com indicadores binários antes de lidar com itens com várias categorias de resposta.

Uma maneira de transformar dados do nível ordinal em escala de intervalo é usar algum tipo de modelo de resposta ao item . Um exemplo bem conhecido é o modelo de Rasch , que amplia a idéia do modelo de teste paralelo da teoria clássica de teste para lidar com itens com pontuação bináriaatravés de um modelo linear generalizado (com link logit) de efeito misto (em algumas implementações de software 'modernas'), em que a probabilidade de endossar um determinado item é uma função da 'dificuldade do item' e da 'capacidade da pessoa' (supondo que não haja interação entre a localização da pessoa na característica latente que está sendo medida e a localização do item na mesma escala de logit - que pode ser capturada por meio de um parâmetro adicional de discriminação de item ou interação com características específicas do indivíduo - que é chamada de funcionamento diferencial do item) O construto subjacente é assumido como unidimensional, e a lógica do modelo Rasch é justamente que o respondente possui uma certa 'quantidade do construto' - vamos falar sobre a responsabilidade do sujeito (sua 'habilidade') e chamá-lo $\theta$ $\theta$

$N=766$ $\alpha=0.971$ $[0.967;0.975]$ ) Inicialmente, foram propostas cinco categorias de resposta (1 = 'Nunca', 2 = 'Raramente', 3 = 'Às vezes', 4 = 'Frequentemente' e 5 = 'Sempre') para cada item. Consideraremos aqui apenas respostas com pontuação binária.

insira a descrição da imagem aqui
_{(Aqui, as respostas aos itens do tipo Likert foram recodificadas como respostas binárias (1/2 = 0, 3-5 = 1), e consideramos que cada item é igualmente discriminativo entre os indivíduos, daí o paralelismo entre as inclinações da curva do item (Rasch modelo).)}

$x$

Para itens politômicos com categorias ordenadas, há várias opções: o modelo de crédito parcial , o modelo em escala de classificação ou o modelo de resposta graduada , para citar apenas alguns que são usados principalmente na pesquisa aplicada. Os dois primeiros pertencem à chamada "família Rasch" dos modelos de TRI e compartilham as seguintes propriedades: (a) monotonicidade da função de probabilidade de resposta (curva de resposta item / categoria), (b) suficiência da pontuação individual total (com latência latente) parâmetro considerado fixo), (c) independência local, o que significa que as respostas aos itens são independentes, dependentes da característica latente; e (d) ausência de funcionamento diferencial dos itens significando que, dependendo da característica latente, as respostas são independentes das variáveis específicas individuais do indivíduo (por exemplo, sexo, idade, etnia, SES).

Estendendo o exemplo anterior ao caso em que as cinco categorias de resposta são efetivamente consideradas, um paciente terá uma probabilidade maior de escolher a categoria de resposta 3 a 5, em comparação com alguém da amostra da população em geral, sem antecedentes de transtornos relacionados à ansiedade. Comparados à modelagem do item dicotômico descrito acima, esses modelos consideram cumulativo (por exemplo, chances de resposta 3 x 2 ou menos) ou limiar de categoria adjacente (chances de resposta 3 x 2), o que também é discutido em Categorias de Agresti Análise de dados(capítulo 12) A principal diferença entre os modelos mencionados acima está na maneira como são tratadas as transições de uma categoria de resposta para a outra: o modelo de crédito parcial não pressupõe que a diferença entre um determinado local de limiar e a média dos locais de limiar na característica latente seja igual ou uniforme entre itens, ao contrário do modelo em escala de classificação. Outra diferença sutil entre esses modelos é que alguns deles (como resposta graduada irrestrita ou modelo de crédito parcial) permitem parâmetros de discriminação desiguais entre os itens. Consulte Aplicando a modelagem da teoria da resposta ao item para avaliar as propriedades do item e da escala do questionário , de Reeve e Fayers, ou A base da teoria da resposta ao item , de Frank B. Baker, para obter mais detalhes.

Como no caso anterior discutimos a interpretação das curvas de probabilidade de respostas para itens com pontuação dicotômica, vejamos as curvas de resposta ao item derivadas de um modelo de resposta graduada, destacando os mesmos itens de destino:

insira a descrição da imagem aqui
_{(Modelo de resposta graduada sem restrições, permitindo discriminação desigual entre os itens.)}

Aqui, as seguintes observações merecem consideração:

$[2;2.5]$
Há uma mudança geral, da esquerda para a direita, entre o item que avalia a qualidade do sono e os que avaliam condições mais graves, embora os distúrbios do sono não sejam incomuns. Isso é esperado: afinal de contas, mesmo as pessoas da população em geral podem ter alguma dificuldade em adormecer, independentemente de seu estado de saúde, e as pessoas gravemente deprimidas ou ansiosas provavelmente exibem esses problemas. No entanto, é improvável que 'pessoas normais' (se isso tiver algum significado) mostre alguns sinais de transtorno do pânico (a probabilidade de escolherem a categoria de resposta mais alta é zero para pessoas localizadas na faixa intermediária ou mais da característica latente, [ 0; 1]).

$\theta$

Além de serem considerados modelos de medição verdadeiramente , o que torna os modelos Rasch atraentes é que as pontuações de soma, como estatística suficiente , podem ser usadas como substitutas das pontuações latentes. Além disso, a propriedade suficiência implica prontamente a separabilidade dos parâmetros do modelo (pessoas e itens) (no caso de itens politômicos, não se deve esquecer que tudo se aplica no nível da categoria de resposta ao item), portanto, aditividade conjunta.

Uma boa revisão da hierarquia do modelo IRT, com a implementação R, está disponível no artigo de Mair e Hatzinger publicado no Journal of Statistical Software : Extensão Rasch Modeling: O Pacote de ERM para a Aplicação de IRT Models em R . Outros modelos incluem modelos log-lineares , modelo não paramétrico, como o modelo Mokken , ou modelos gráficos .

Além do R, não conheço as implementações do Excel, mas vários pacotes estatísticos foram propostos neste segmento: Como começar a aplicar a teoria da resposta ao item e qual software usar?

Por fim, se você deseja estudar as relações entre um conjunto de itens e uma variável de resposta sem recorrer a um modelo de medição, alguma forma de quantização de variáveis por meio do dimensionamento ideal também pode ser interessante. Além das implementações de R discutidas nesses threads, as soluções SPSS também foram propostas em threads relacionados .

Referências

Pilkonis, P., Choi, S., Reise, S., Stover, A. e Riley, W. et al. (2011). Bancos de itens para medir o estresse emocional do sistema de informações de medição de resultados relatados pelo paciente (PROMIS): Depressão, ansiedade e raiva . Assessment , 18 (3), 263–283.
Choi, S., Gibbons, L. e Crane, P. (2011). lordif: Um pacote R para detectar o funcionamento diferencial de itens usando regressão logística ordinal híbrida iterativa / teoria de resposta a itens e simulações de monte carlo . Journal of Statistical Software , 39 (8).

— chl
fonte

@Momo Obrigado. Isso é curioso. Ao responder (e reeditar esta resposta hoje), não notei seu comentário que vale um +1. Sinta-se à vontade para editar minha resposta onde achar melhor.

— chl

Em seu livro Análise de dados categóricos ordinais , Alan Agresti cobre vários. Um deles é o remit, que discuto no meu blog

— Peter Flom - Restabelece Monica
fonte

Você pode explicar isso um pouco mais? À primeira vista, parece que qualquer método que afirme converter objetivamente dados ordinais em dados intervalares seria mágico, pois parece que você sempre pode dar contra-exemplos não tão patológicos que "quebrariam" qualquer método, mas eu poderia estar perdendo alguma coisa importante. Também parece que exigiria uma noção a priori da distância entre categorias ordinais - de onde isso vem?

— Macro

As fórmulas estão no post do blog e há uma discussão completa no livro de Agresti, mas, essencialmente, ele usa os dados para criar "proporções cumulativas médias" e depois as usa como pontuação. A distância vem das proporções em cada resposta, e não de qualquer coisa nas próprias categorias.

— Peter Flom - Restabelece Monica

+1. Ridits são facilmente explicados como fração menos + (1/2) fração igual. Assim, se 1, 2, 3, 4, 5 observaram frações ou probabilidades 0,2, 0,4, 0,2, 0,1, 0,1, então a quantidade de 1 é 0,1; o de 2 é 0,4, etc. Os Ridits tratam as categorias simetricamente e são menos prováveis do que a fração menos ou a fração mais a incluir 0 ou 1 como resultado, o que geralmente é incômodo.

— Nick Cox

O próprio nome ridit foi pretendido por Bross (nota: referência necessária) e a suposta explicação é sem sentido. Nomes melhores são função de distribuição intermediária (Parzen 1993) e função de nota Haberman (1996). Haberman, SJ 1996. Volume de Estatísticas Avançadas I: Descrição de Populações . Nova York: Springer. Parzen, E. 1993. Mude o gráfico de PP e a função quantil da amostra contínua. Comunicações em Estatística - Teoria e Métodos 22: 3287-3304.

— Nick Cox

Os próprios limites podem ser aplicados através, por exemplo, de funções quantis normais ou gaussianas.

— Nick Cox