Assumirei que uma variável "categórica" na verdade representa uma variável ordinal; caso contrário, não faz muito sentido tratá-lo como contínuo, a menos que seja uma variável binária (codificada 0/1) como apontado por @Rob. Então, eu diria que o problema não é tanto assim como tratamos a variável, embora muitos modelos de análise de dados categóricos tenham sido desenvolvidos até agora - veja, por exemplo, A análise de dados categóricos ordenados: uma visão geral e uma pesquisa recente desenvolvimentos de Liu e Agresti--, do que a escala de medição subjacente que assumimos. Minha resposta se concentrará nesse segundo ponto, embora eu primeiro discuta brevemente a atribuição de pontuações numéricas a categorias ou níveis variáveis.
Usando uma recodificação numérica simples de uma variável ordinal, você assume que a variável possui propriedades de intervalo (no sentido da classificação dada por Stevens, 1946). Do ponto de vista da teoria da medida (em psicologia), isso pode ser uma suposição muito forte, mas para o estudo básico (ou seja, onde um único item é usado para expressar a opinião de alguém sobre uma atividade diária com palavras claras), qualquer pontuação monótona deve fornecer resultados comparáveis . Cochran (1954) já apontou que
qualquer conjunto de pontuações fornece um
teste válido , desde que elas sejam construídas sem consultar os resultados do experimento. Se o conjunto de pontuações for ruim, pois distorce mal uma escala numérica que realmente está subjacente à classificação ordenada, o teste não será sensível. As pontuações devem, portanto, incorporar a melhor percepção disponível sobre a maneira como a classificação foi construída e usada. (p. 436)
(Muito obrigado a @whuber por me lembrar disso em um de seus comentários, o que me levou a reler o livro de Agresti, do qual essa citação vem.)
Na verdade, vários testes tratam implicitamente variáveis como escalas de intervalo: por exemplo, a estatística para testar uma tendência linear (como uma alternativa à independência simples) é baseada em uma abordagem correlacional ( , Agresti, 2002, p. 87).M 2 = ( n - 1 ) r 2M2M2=(n−1)r2
Bem, você também pode decidir recodificar sua variável em um intervalo irregular ou agregar alguns de seus níveis, mas, neste caso, um forte desequilíbrio entre categorias recodificadas pode distorcer os testes estatísticos, por exemplo, o teste de tendência mencionado acima. Uma boa alternativa para atribuir distância entre categorias já foi proposta pelo @Jeromy, ou seja, escala ideal.
Agora, vamos discutir o segundo ponto que fiz, o do modelo de medição subjacente. Estou sempre hesitando em adicionar a tag "psicometria" quando vejo esse tipo de pergunta, porque a construção e a análise de escalas de medição estão sob a Teoria Psicométrica (Nunnally e Bernstein, 1994, para uma visão geral clara). Não vou me debruçar sobre todos os modelos que estão de fato sob a Teoria da Resposta ao Item e, por gentileza, remeto o leitor interessado para o tutorial de I. Partchev, Um guia visual para a teoria da resposta ao item, para uma introdução suave ao IRT e às referências (5-8) listadas no final para possíveis taxonomias do IRT. Muito brevemente, a idéia é que, em vez de atribuir distâncias arbitrárias entre categorias variáveis, você assume uma escala latente e estima sua localização nesse continuum, juntamente com a capacidade ou a responsabilidade dos indivíduos. Um exemplo simples vale muita notação matemática, portanto, vamos considerar o seguinte item (proveniente do questionário de qualidade de vida relacionado à saúde do EORTC QLQ-C30 ):
Você se preocupou?
que é codificado em uma escala de quatro pontos, variando de "Nada" a "Muito". As pontuações brutas são calculadas atribuindo-se uma pontuação de 1 a 4. Pontuações nos itens pertencentes à mesma escala podem então ser somadas para gerar a chamada pontuação da escala, que indica a classificação de alguém no construto subjacente (aqui, um componente de saúde mental ) Essas pontuações na escala resumida são muito práticas por causa da facilidade de pontuação (para o médico ou enfermeiro), mas não passam de uma escala discreta (ordenada).
Também podemos considerar que a probabilidade de endossar uma determinada categoria de resposta obedece a algum tipo de modelo logístico, conforme descrito no tutorial de I. Partchev, mencionado acima. Basicamente, a ideia é a de um tipo de modelo de limiar (que leva a uma formulação equivalente em termos dos modelos de chances proporcionais ou cumulativas) e modelamos as chances de estar em uma categoria de resposta em vez da anterior ou as chances de pontuação acima de um determinada categoria, condicional à localização dos sujeitos na característica latente. Além disso, podemos impor que as categorias de resposta sejam igualmente espaçadas na escala latente (este é o modelo da Escala de Classificação) - que é o modo como fazemos atribuindo pontuações numéricas regularmente espaçadas - ou não (este é o modelo de Crédito Parcial) .
Claramente, não estamos adicionando muito à Teoria Clássica dos Testes, onde as variáveis ordinais são tratadas como numéricas. No entanto, introduzimos um modelo probabilístico, em que assumimos uma escala contínua (com propriedades de intervalo) e onde erros específicos de medição podem ser contabilizados, e podemos inserir esses escores fatoriais em qualquer modelo de regressão.
Referências
- SS Stevens. Na teoria das escalas de medida. Science , 103 : 677-680, 1946.
- WG Cochran. Alguns métodos para fortalecer os comuns . Biometrics , 10 : 417-451, 1954.χ2
- J Nunnally e eu Bernstein. Teoria psicométrica . McGraw-Hill, 1994
- Alan Agresti. Análise de dados categóricos . Wiley, 1990.
- CR Rao e S Sinharay, editores. Handbook of Statistics, vol. 26: Psicometria . Elsevier Science BV, Holanda, 2007.
- A Boomsma, MAJ van Duijn e TAB Snijders. Ensaios sobre a Teoria da Resposta ao Item . Springer, 2001.
- D. Thissen e L. Steinberg. Uma taxonomia de modelos de resposta a itens. Psychometrika , 51 (4) : 567-577, 1986.
- P. Mair e R. Hatzinger. Extensão Rasch Modeling: O Pacote de ERM para a aplicação de modelos da TRI em R . Journal of Statistical Software , 20 (9) , 2007.