Estou examinando tendências (entre 1998 e 2011) nas taxas de mortalidade entre pacientes com doença de Crohn. Cada paciente (caso) foi incluído entre 1998 e 2011. Na inclusão, cada paciente foi comparado a um controle saudável com a mesma idade e sexo. Estou analisando tendências nas taxas de mortalidade. Ao fazer isso diretamente, sem nenhum ajuste, obtenho taxas de mortalidade flutuantes ao longo do tempo, o que provavelmente se deve ao fato de os indivíduos incluídos em um determinado ano não serem comparáveis aos incluídos em outro ano. Assim, pretendo ajustar as taxas de mortalidade. Espero que as taxas de mortalidade em ambos os grupos (casos e controles) diminuam com o tempo e a diferença entre casos e controles diminua sucessivamente.
Minha idéia é fazer o ajuste por meio da regressão de Poisson. Meus dados estão no nível individual. Desejo obter uma estimativa da taxa de incidência (por 1.000 pessoas / ano) para casos e controles a cada ano de 1998 a 2011. O tempo de sobrevivência seria incluído como compensação no modelo. Algo semelhante foi feito aqui .
Anexei as 200 primeiras linhas do meu conjunto de dados, que consiste em 1500 indivíduos. Aqui estão os dados . Explicação variável:
- morto = se o paciente morreu ou não durante o acompanhamento
- surv = tempo de sobrevivência em dias
- grupo de grupos = faixa etária categorizada (4 grupos)
- sexo = masculino / feminino
- diagnóstico = 0 para controle saudável, 1 para doença de Crohn
- idade = idade em anos
- inclusão_ano = ano de inclusão no estudo
O que eu tentei até agora? Tentei ajustar os modelos de Poisson com a função glm () em R, usando observações individuais (log (surv) como deslocamento), mas recebi um erro ou não consegui descobrir como usar os ajustes. Também agreguei os dados em grupos e analisei as contagens de mortes em glm (); quando usei o ajuste para obter taxas de incidência, só consegui obter taxas para uma idade / grupo de grupos e sexo específicos (conforme necessário na especificação () da função ().
Eu realmente aprecio alguns conselhos estatísticos e exemplos de codificação, que podem ser feitos no conjunto de dados anexado.
contrasts<-
( *tmp*
, valor = contr.funs [1 + ISOF [nn]]): contrastes só pode ser aplicado a factores de 2 ou mais níveis
diagnosis*inclusion_year
termos de interação. Se você apenas usar o modelo atual, o número do caso diferirá apenas pelo beta de diagnosis
, constante ao longo dos anos, porque não é permitido interagir. Posteriormente, o previsto será apenas substituição. Eu não sou muito exigente, então eu apenas subsiste a idade média e a porcentagem média masculina.