Estou tentando lidar com uma análise de tempo para evento usando resultados binários repetidos. Suponha que o tempo do evento seja medido em dias, mas, no momento, discretizamos o tempo em semanas. Quero aproximar um estimador de Kaplan-Meier (mas permitir covariáveis) usando resultados binários repetidos. Parece uma maneira indireta, mas estou explorando como isso se estende a resultados ordinais e eventos recorrentes.
Se você criar uma sequência binária que pareça 000 para alguém censurado em 3 semanas, 0000 para alguém censurado em 4w e 0000111111111111 .... para um sujeito que falhou em 5w (os 1s se estendem até o ponto em que o último sujeito foi seguido no estudo), quando você calcula proporções de 1s específicas da semana, pode obter incidências cumulativas comuns (até chegar a tempos de censura variáveis, onde isso apenas se aproxima, mas não é igual às estimativas de incidência cumulativa de Kaplan-Meier).
Posso ajustar as observações binárias repetidas com um modelo logístico binário usando GEE, em vez de tornar o tempo discreto como acima, mas usando um spline no tempo. O estimador de covariância em sanduíche de cluster funciona razoavelmente bem. Mas eu gostaria de obter uma inferência mais exata usando um modelo de efeitos mistos. O problema é que o 1 após o primeiro 1 é redundante. Alguém sabe como especificar efeitos aleatórios ou especificar um modelo que leve em consideração as redundâncias para que os erros padrão não sejam esvaziados?
Observe que essa configuração difere da de Efron porque ele estava usando modelos logísticos para estimar probabilidades condicionais em conjuntos de riscos. Estou estimando probabilidades incondicionais.
GLMMadaptive
pacote parece ótimo para a configuração mais geral.