Eu tenho um conjunto de dados que contém ~ 7.500 exames de sangue de ~ 2.500 indivíduos. Estou tentando descobrir se a variabilidade nos exames de sangue aumenta ou diminui com o tempo entre dois testes. Por exemplo - colho seu sangue para o teste de linha de base e, em seguida, colho imediatamente uma segunda amostra. Seis meses depois, eu desenho outra amostra. Pode-se esperar que a diferença entre a linha de base e os testes de repetição imediata seja menor que a diferença entre a linha de base e o teste de seis meses.
Cada ponto no gráfico abaixo reflete a diferença entre dois testes. X é o número de dias entre dois testes; Y é o tamanho da diferença entre os dois testes. Como você pode ver, os testes não são distribuídos igualmente ao longo do X - o estudo não foi projetado para abordar essa questão, realmente. Como os pontos estão muito empilhados na média, incluí linhas quantílicas de 95% (azul) e 99% (vermelho), com base em janelas de 28 dias. Obviamente, esses são os pontos mais extremos, mas você entendeu.
texto alternativo http://a.imageshack.us/img175/6595/diffsbydays.png
Parece-me que a variabilidade é bastante estável. Na verdade, é mais alto quando o teste é repetido em um curto período - isso é terrivelmente contra-intuitivo. Como posso resolver isso de uma maneira sistemática, respondendo pela variação de n em cada momento (e em alguns períodos sem testes)? Suas idéias são muito apreciadas.
Apenas para referência, esta é a distribuição do número de dias entre teste e reteste:
texto alternativo http://a.imageshack.us/img697/6572/testsateachtimepoint.png