Eu tenho um experimento que produzirá observações do tempo até que um evento ocorra. Algumas propriedades básicas são que
- Contamos o número de eventos que ocorreram em algum momento .
- Os horários dos eventos são censurados por intervalo, entre ,
- Os indivíduos não deixarão a avaliação entre , ou seja, um indivíduo experimenta o evento por ou não, quando é censurado,
- Uma grande proporção dos indivíduos não receberá o evento por , quando encerrarmos o experimento, e
- Não posso assumir nenhum modelo de decaimento paramétrico subjacente.
Parece ser uma aplicação natural para análise de sobrevivência. No entanto, é complicado pelo fato de ser trivial repetir o experimento da mesma configuração inicial várias vezes. Com efeito, teremos um conjunto de contagens de eventos (onde é o número de amostras) para cada tempo de observação . Sou relativamente novo em estatística e estou lutando para ver como aplicar a análise de sobrevivência a esses dados (se é que é aplicável e se não existem métodos mais apropriados para medir esse tipo de dados de tempo até o evento). Minha inclinação é construir a função de sobrevivência em torno do número médio de eventos observados em cada intervalo (por exemplo,), que deve aproximar melhor o número esperado de eventos em cada intervalo da população; no entanto, não tenho idéia se isso é apropriado ou suas implicações.
Eu procurei sem sucesso no Google Scholar, se alguém pudesse me indicar mais material (ou me fornecer a nomenclatura correta para o que estou tentando fazer), isso seria apreciado.
Editar
Dado que os intervalos são uniformes em todas as amostras, digamos que eu tenha a seguinte matriz descrevendo o número cumulativo de indivíduos para os quais um evento ocorreu em cada intervalo
onde cada linha fornece a contagem de eventos para o mesmo conjunto de indivíduos em risco em em todas as amostras (ou seja, várias instâncias do experimento) e cada coluna é um intervalo de observação. Suponho que, tomando o número médio de eventos para cada intervalo, eu possa obter uma melhor estimativa da sobrevivência esperada da população, portanto, denote o número de intervalos de tempo, denote o número de amostras (instâncias do experimento) e, em seguida, o vetorn s
será o número médio de eventos observados para cada intervalo de tempo.
Meu objetivo, então, é usar isso como entrada para a estimativa de sobrevivência. Seja o número de indivíduos em risco quando . Usando o estimador ingênuo (por enquanto, considerando que os intervalos de eventos são uniformes em todas as amostras e não há censura até ), a função sobrevivente pode ser estimada como:t = 0 t n
O que (espero) seria uma estimativa melhor da sobrevivência da população do que qualquer amostra individual (uma única linha de ). Para reformular minha pergunta:
- É uma entrada apropriada a uma estimativa de função de sobrevivência? Não vi essa abordagem em nenhum dos materiais que li.
- Como sou realmente um novato em estatística, alguém pode me indicar algum material (trabalhos acadêmicos, livros didáticos, wikis etc. seria bom) para estimar o intervalo de confiança e a variação para essa estimativa da função de sobrevivência? Presumo que não será idêntico às formulações padrão.
Desculpas se minha pergunta original foi confusa, provavelmente não incluí informações suficientes.