Contexto
Estou tentando entender como o coxph (R) aceita e lida com entradas repetidas para assuntos (ou paciente / cliente, se você preferir). Alguns chamam isso de formato longo, outros chamam de 'medidas repetidas'.
Veja, por exemplo, o conjunto de dados que inclui a coluna ID na seção Respostas em:
Melhores pacotes para modelos Cox com covariáveis variáveis no tempo
Suponha também que as covariáveis variam no tempo e existe exatamente uma variável de censor (ou seja, evento), que é binária.
Questões
1) Na resposta do link acima, se o ID não for fornecido como parâmetro na chamada para coxph (), os resultados devem ser os mesmos que incluir cluster (ID) como parâmetro no coxph ()?
Tentei procurar documentação, mas o seguinte não parece abordar claramente (1): https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html
2) Se a resposta a (1) é 'não', então (matematicamente) por que? Parece que cluster () no coxph () procura correlações entre os sujeitos conforme a subseção 'cluster' na pág. 20 em
https://cran.r-project.org/web/packages/survival/survival.pdf
3) Pergunta vaga: como o coxph () com medidas repetidas se compara aos métodos de regressão do fragiltypack de R?
Adendos
As seguintes dicas sobre o uso do cluster (ID):
Existe uma versão ciente das medidas repetidas do teste de logrank?
como faz:
https://stat.ethz.ch/pipermail/r-help//2013-July/357466.html
Abordagem GEE: adicione "+ cluster (assunto)" à declaração do modelo no coxph Abordagem de modelos mistos: adicione "+ (1 | assunto)" à declaração do modelo no coxme.
Desde já, obrigado!