R2(descrito em outra resposta) é que depende muito da distribuição de censura dos seus dados. Outras coisas naturais que você pode observar, como a taxa de probabilidade do modelo nulo, também têm esse problema. (Isso ocorre basicamente porque a contribuição de um ponto de dados censurado para a probabilidade é muito diferente da contribuição de um ponto de dados no qual o evento é observado, porque um deles vem de um PDF e um de CDF.) Vários pesquisadores têm propuseram maneiras de contornar isso, mas as que eu vi geralmente exigem que você tenha um modelo de distribuição de censura ou algo igualmente impraticável. Eu não analisei o quão ruim essa dependência é na prática; portanto, se a sua censura for bastante moderada, você ainda poderá analisar as estatísticas baseadas na razão de probabilidade. Para modelos CART de sobrevivência,
τtambém é menos sensível que as estatísticas acima, portanto, talvez você não queira escolher entre modelos com base nele, se a diferença entre eles for pequena; é mais útil como um índice interpretável de desempenho geral do que como uma maneira de comparar diferentes modelos.
(Por fim, é claro, se você tem um objetivo específico em mente para os modelos - ou seja, se você sabe qual é a sua função de perda de previsão - você sempre pode avaliá-los de acordo com a função de perda! Mas eu acho que você ' não tem tanta sorte ...)
Para uma discussão mais aprofundada das estatísticas da razão de verossimilhança e do c de Harrell , você deve examinar o excelente livro didático de Harrell, Regression Modeling Strategies . A seção sobre avaliação de modelos de sobrevivência é §19.10, pp. 492-493. Sinto muito, mas não posso lhe dar uma resposta definitiva, mas não acho que seja um problema resolvido!