Parece que você pode usar a codificação para uma variável categórica, mas eu tenho duas variáveis categóricas e uma variável preditora contínua. Posso usar regressão múltipla para isso no SPSS? Em caso afirmativo, como? obrigado!
Parece que você pode usar a codificação para uma variável categórica, mas eu tenho duas variáveis categóricas e uma variável preditora contínua. Posso usar regressão múltipla para isso no SPSS? Em caso afirmativo, como? obrigado!
Respostas:
Você definitivamente pode, seguindo o mesmo método usado para o primeiro preditor categórico. Crie variáveis fictícias como faria para a primeira variável. Mas geralmente é mais fácil usar o comando Unianova do SPSS. Você pode procurar isso em qualquer Guia de sintaxe impresso ou em pdf, ou pode acessá-lo através de Analisar ... Modelo linear geral ... Univariada.
Apesar de um pouco mais complicado, o comando Regression tem várias vantagens sobre o Unianova. O principal é que você pode escolher 'falta par aos pares' (você não precisa perder um caso simplesmente porque está faltando um valor para um ou dois preditores). Você também pode obter muitos diagnósticos valiosos, como gráficos parciais e estatísticas de influência.
Uma maneira simples de transformar variáveis categóricas em um conjunto de variáveis fictícias para uso em modelos no SPSS é usar a sintaxe do repeat. É o mais simples de usar se suas variáveis categóricas estiverem em ordem numérica.
*making vector of dummy variables.
vector dummy(3,F1.0).
*looping through dummy variables using do repeat, in this example category would be the categorical variable to recode.
do repeat dummy = dummy1 to dummy3 /#i = 1 to 3.
compute dummy = 0.
if category = #i dummy = 1.
end repeat.
execute.
Caso contrário, você pode simplesmente executar um conjunto de instruções if para criar suas variáveis fictícias. Minha versão atual (16) não tem capacidade nativa de especificar um conjunto de variáveis fictícias automaticamente no comando regression (como você pode no Stata usando o comando xi ), mas não ficaria surpreso se isso estiver disponível em alguma versão mais recente. Observe também o ponto 2 de dmk38, este esquema de codificação está assumindo categorias nominais. Se sua variável for ordinal, mais discrição poderá ser usada.
Também concordo com o dmk38 e a discussão sobre a regressão ser melhor devido à sua capacidade de especificar dados ausentes de uma maneira específica é uma questão completamente separada.