Estou fazendo uma regressão de riscos proporcionais de Cox em R usando coxph
, que inclui muitas variáveis. Os resíduos de Martingale parecem ótimos, e os resíduos de Schoenfeld são ótimos para QUASE todas as variáveis. Existem três variáveis cujos resíduos de Schoenfeld não são planos e a natureza das variáveis é tal que faz sentido que elas possam variar com o tempo.
Essas são variáveis nas quais não estou realmente interessado, portanto, seria bom fazê-las. No entanto, todos eles são variáveis contínuas, não variáveis categóricas. Portanto, percebo que os estratos não são uma rota viável *. Eu tentei criar interações entre as variáveis e o tempo, conforme descrito aqui , mas obtemos o erro:
In fitter(X, Y, strats, offset, init, control, weights = weights, :
Ran out of iterations and did not converge
Estou trabalhando com quase 1000 pontos de dados e trabalhando com meia dúzia de variáveis com muitos fatores cada, então parece que estamos pressionando os limites de como esses dados podem ser fatiados e cortados em cubos. Infelizmente, todos os modelos mais simples que tentei com menos variáveis incluídas são claramente piores (por exemplo, os resíduos de Schoenfeld são mais fracos para mais variáveis).
Quais são as minhas opções? Como não me importo com essas variáveis mal comportadas em particular, gostaria de ignorar a saída delas, mas suspeito que não seja uma interpretação válida!
* Um é contínuo, um é um número inteiro com um intervalo superior a 100 e um é um número inteiro com um intervalo de 6. Talvez o binning?