Eu tinha algumas perguntas sobre a interpretação de odds ratio para variáveis contínuas na regressão logística. Sinto que essas são perguntas básicas sobre regressão logística (e provavelmente sobre regressão em geral) e, embora tenha um pouco de vergonha de não saber as respostas, vou engolir meu orgulho e perguntar a elas para que eu as conheça. o futuro!
Aqui está minha situação ... Estou vendo uma amostra de jovens adjudicados que, como parte de sua liberdade condicional, estavam matriculados em um programa de treinamento de habilidades para a vida profissional. Eu queria ver até que ponto a idade em que eles foram liberados do programa previa emprego seis meses após o lançamento do programa.
(Além disso, lembre-se de que existem outros preditores no modelo, mas eu os excluí porque eles não são estatisticamente significativos e eu quero manter isso o mais claro possível.)
Preditor: idade de liberação do programa de treinamento (idade média = 17,4, DP = 1,2, intervalo 14,3-20,5)
Resultado: Empregado ou não (Empregado = 1, Não Empregado = 0)
Resultado: Odds ratio 3.01 (p <.005) (excluí as estatísticas de qualidade do ajuste, etc. porque estou procurando respostas sobre a interpretação apenas do odds ratio; me sinto confortável com a avaliação do ajuste do modelo, ICs etc.)
Colocando em palavras: À medida que a idade aumenta em um ano, as chances de ser empregado seis meses após a alta aumentam em três unidades.
Questões:
1) Quando digo: "À medida que a idade aumenta em um ano ...", qual é o ponto de partida para a idade?
A idade começa em zero? Por exemplo, "À medida que a idade aumenta de 0 [ou seja, a idade mais baixa se você colocar esse modelo em um gráfico] ..."
A idade começa na idade mais baixa entre as faixas etárias da amostra? Por exemplo, "À medida que a idade aumenta de 14,3 ..."
OU
A idade começa na idade média da amostra? Por exemplo, "À medida que a idade aumenta de 17,4 ...",
2) A centralização me ajudaria a interpretar esse resultado OU isso só é eficaz na interpretação do y-int? Se isso ajudasse, eu estava pensando em centralizar ou subtrair a idade mais baixa do intervalo de todas as outras idades da amostra. Alguma sugestão?
3) Finalmente, é apropriado dizer que, comparado a um jovem de 14 anos, um jovem de 17 anos tem nove vezes mais chances de ser empregado? Pergunto porque sei que a regressão logística assume uma relação sigmoidal, e estou curioso para saber se esse aumento de três unidades nas probabilidades permanece consistente a qualquer momento ao longo da linha de regressão.
Muito obrigado!
Aaron