Respostas:
O @ Scortchi cobre você com esta resposta em Codificação para uma covariável ordenada . Repeti a recomendação da minha resposta ao Efeito de dois IVs demográficos nas respostas da pesquisa (escala Likert) . Especificamente, a recomendação é usar Gertheiss' (2013) pacote ordPens , e submeter ao Gertheiss e Tutz (2009a) para o fundo teórico e um estudo de simulação.
A função específica que você provavelmente deseja é ordSmooth
* . Isso suaviza essencialmente os coeficientes fictícios nos níveis de variáveis ordinais para que sejam menos diferentes daqueles das fileiras adjacentes, o que reduz o ajuste excessivo e melhora as previsões. Geralmente, o desempenho é tão bom (ou, às vezes, muito) melhor que a probabilidade máxima (ou seja, neste caso, mínimos quadrados ordinários) de um modelo de regressão para dados contínuos (ou em seus termos métricos) quando os dados são realmente ordinais. Parece compatível com todos os tipos de modelos lineares generalizados e permite inserir preditores nominais e contínuos como matrizes separadas.
Várias referências adicionais de Gertheiss, Tutz e colegas estão disponíveis e listadas abaixo. Algumas delas podem conter alternativas - até Gertheiss e Tutz (2009a) discutem o cume como outra alternativa. Ainda não pesquisei tudo, mas basta dizer que isso resolve o problema de Erik, com pouca literatura sobre preditores ordinais!
Referências
- Gertheiss, J. (2013, 14 de junho). ordPens: Seleção e / ou suavização de preditores ordinais , versão 0.2-1. Recuperado em http://cran.r-project.org/web/packages/ordPens/ordPens.pdf .
- Gertheiss, J., Hogger, S., Oberhauser, C., & Tutz, G. (2011). Seleção de variáveis independentes de escala ordinal com aplicações para a classificação internacional de conjuntos de funções em funcionamento. Jornal da Sociedade Estatística Real: Série C (Estatística Aplicada), 60 (3), 377–395.
- Gertheiss, J. & Tutz, G. (2009a). Regressão penalizada com preditores ordinais. International Statistical Review, 77 (3), 345-365. Recuperado de http://epub.ub.uni-muenchen.de/2100/1/tr015.pdf .
- Gertheiss, J. & Tutz, G. (2009b). Seleção supervisionada de recursos em perfis proteômicos baseados em espectrometria de massa por impulso em blocos. Bioinformtics, 25 (8), 1076-1077.
- Gertheiss, J. & Tutz, G. (2009c). Escala variável e métodos vizinhos mais próximos. Journal of Chemometrics, 23 (3), 149-151. - Gertheiss, J. & Tutz, G. (2010). Modelagem esparsa de variáveis explicativas categoriais.
The Annals of Applied Statistics, 4 , 2150–2180.
- Hofner, B., Hothorn, T., Kneib, T. e Schmid, M. (2011). Uma estrutura para a seleção imparcial de modelos com base no aumento. Jornal de Estatísticas Gráficas e Computacionais, 20 (4), 956–971. Retirado de http://epub.ub.uni-muenchen.de/11243/1/TR072.pdf .
- Oelker, M.R., Gertheiss, J., & Tutz, G. (2012). Regularização e seleção de modelos com preditores categoriais e modificadores de efeito em modelos lineares generalizados. Departamento de Estatística: Relatórios Técnicos, No. 122 . Recuperado de http://epub.ub.uni-muenchen.de/13082/1/tr.gvcm.cat.pdf .
- Oelker, M.R. & Tutz, G. (2013). Uma família geral de penalidades para combinar diferentes tipos de penalidades em modelos estruturados generalizados. Departamento de Estatística: Relatórios Técnicos, nº 139 . Recuperado em http://epub.ub.uni-muenchen.de/17664/1/tr.pirls.pdf .
- Petry, S., Flexeder, C., & Tutz, G. (2011). Laço fundido em pares. Departamento de Estatística: Relatórios Técnicos, Nº 102. Recuperado em http://epub.ub.uni-muenchen.de/12164/1/petry_etal_TR102_2011.pdf .
- Rufibach, K. (2010). Um algoritmo de conjunto ativo para estimar parâmetros em modelos lineares generalizados com preditores ordenados. Estatística Computacional e Análise de Dados, 54 (6), 1442–1456. Recuperado em http://arxiv.org/pdf/0902.0240.pdf?origin=publication_detail .
- Tutz, G. (2011, outubro). Métodos de regularização para dados categóricos. Munique: Ludwig-Maximilians-Universität. Recuperado em http://m.wu.ac.at/it/departments/statmath/resseminar/talktutz.pdf .
- Tutz, G. e Gertheiss, J. (2013). Escalas de classificação como preditores - A velha questão do nível de escala e algumas respostas.Psychometrika , 1-20.
Quando existem múltiplos preditores e o preditor de interesse é ordinal, geralmente é difícil decidir como codificar a variável. A codificação como categórica perde as informações do pedido, enquanto a codificação como numérica impõe linearidade aos efeitos das categorias ordenadas que podem estar longe de seus verdadeiros efeitos. Para o primeiro, a regressão isotônica foi proposta como uma maneira de abordar a não monotonicidade, mas é um procedimento de seleção de modelo orientado a dados, que, como muitos outros procedimentos orientados a dados, requer uma avaliação cuidadosa do modelo ajustado final e da significância de seus parâmetros. Para o último, splines podem mitigar parcialmente a suposição rígida de linearidade, mas os números ainda precisam ser atribuídos a categorias ordenadas, e os resultados são sensíveis a essas opções. Em nosso artigo (Li e Shepherd, 2010, Introdução, parágrafos 3-5),
Desenvolvemos um pacote R, PResiduals , disponível no CRAN. O pacote contém funções para executar nossa abordagem para tipos de resultados lineares e ordinais. Estamos trabalhando para adicionar outros tipos de resultados (por exemplo, contagem) e recursos (por exemplo, permitindo interações). O pacote também contém funções para calcular nosso residual, que é um residual em escala de probabilidade, para vários modelos de regressão.
Referências
Li, C. & Shepherd, BE (2010). Teste de associação entre duas variáveis ordinais durante o ajuste para covariáveis. JASA, 105, 612-620.
Li, C. & Shepherd, BE (2012). Um novo resíduo para resultados ordinais. Biometrika 99, 473-480.
Geralmente, há muita literatura sobre variáveis ordinais como dependentes e pouco em usá-las como preditores. Na prática estatística, eles geralmente são considerados contínuos ou categóricos. Você pode verificar se um modelo linear com o preditor como variável contínua se parece com um bom ajuste, verificando os resíduos.
Às vezes, eles também são codificados cumulativamente. Um exemplo seria que uma variável ordinal x1 com os níveis 1,2 e 3 tenha uma variável binária dummy d1 para x1> 1 e uma variável binária fictícia d2 para x1> 2. Então o coeficiente para d1 é o efeito que você obtém ao aumentar seu ordinal de 2 para 3 e o coeficiente para d2 é o efeito que obtém quando você ordinal de 2 para 3.
Isso facilita muito a interpretação, mas é equivalente a usá-la como uma variável categórica para fins práticos.
Gelman até sugere que se possa usar o preditor ordinal como um fator categórico (para os efeitos principais) e como variável contínua (para interações) para aumentar a flexibilidade dos modelos.
Minha estratégia pessoal geralmente é verificar se tratá-los como contínuos faz sentido e resulta em um modelo razoável e apenas os utilizo como categóricos, se necessário.