Eu tenho os resultados de um exame de sangue administrado a 2500 pessoas quatro vezes em intervalos de seis meses. Os resultados consistem principalmente em duas medidas de resposta imune - uma na presença de certos antígenos da tuberculose, uma na ausência. Atualmente, cada teste é avaliado positivo ou negativo com base na diferença entre a resposta do antígeno e a resposta nula (com a idéia de que, se o sistema imunológico responder aos antígenos da TB, você provavelmente já foi exposto à bactéria em algum momento ) Em essência, o teste supõe que as distribuições de respostas de zero e TB de um indivíduo não exposto sejam basicamente idênticas, enquanto uma pessoa com exposição à TB terá respostas de TB extraídas de uma distribuição diferente (de valores mais altos). Embargo: as respostas são muito, muito não normais e os valores se agrupam no piso natural e no teto truncado pelo instrumento.
No entanto, parece bem claro nesse cenário longitudinal que estamos recebendo "falsos positivos" (receio que não haja um padrão ouro real para tuberculose latente) causados por flutuações (geralmente pequenas) nas respostas a antígenos e a nada. Embora seja difícil evitar isso em algumas situações (você pode ter apenas uma chance de testar alguém), há muitas situações nas quais as pessoas são testadas rotineiramente para TB todos os anos, mais ou menos - nos EUA, isso é comum para os profissionais de saúde, os militares, pessoas sem-teto que ficam em abrigos e assim por diante. Parece uma pena ignorar os resultados de testes anteriores, porque os critérios existentes são transversais.
Eu acho que o que eu gostaria de fazer é o que eu concebo grosseiramente como análise longitudinal de mistura. Muito parecido com os critérios transversais, eu gostaria de poder estimar a probabilidade de que as respostas de TB e zero de um indivíduo sejam extraídas da mesma distribuição - mas essa estimativa incorpora resultados de testes anteriores, além de informações da amostra como um todo (por exemplo, posso usar a distribuição de toda a amostra de variabilidades intraindividuais para melhorar minhas estimativas da distribuição de um indivíduo específico de zero ou TB?). A probabilidade estimada precisaria ser capaz de mudar com o tempo, é claro, para explicar a possibilidade de nova infecção.
Fiquei totalmente distorcido tentando pensar sobre isso de maneiras incomuns, mas sinto que essa conceitualização é tão boa quanto qualquer outra que eu possa inventar. Se algo não fizer sentido, não hesite em pedir esclarecimentos. Se minha compreensão da situação parecer errada, não hesite em me dizer. Muito obrigado pela sua ajuda.
Em resposta a Srikant: É um caso de classificação latente (infectada ou não por TB) usando os dois resultados de teste contínuos (mas não normais e truncados). No momento, essa classificação é feita usando um ponto de corte (em sua forma simplificada, TB - nil> 0,35 -> positivo). Com os resultados dos testes apresentados como (zero, TB, resultado), os arquétipos básicos * são:
Negativo provável: (0,06, 0,15, -) (0,24, 0,23, -) (0,09, 0,11, -) (0,16, 0,15, -)
Positivo provável: (0,05, 3,75, +) (0,05, 1,56, +) (0,06 , 5,02, +) (0,08, 4,43, +)
Wobbler: (0,05, 0,29, -) (0,09, 0,68, +) (0,08, 0,31, -) (0,07, 0,28, -)
O positivo no segundo teste para o Wobbler é claramente uma aberração, mas como você modelaria isso? Embora uma linha do meu pensamento seja estimar a "verdadeira diferença" entre TB e zero a cada momento, usando um modelo multinível de medidas repetidas, ocorreu-me que o que realmente quero saber é se a resposta nula e a resposta da TB da pessoa são retirados da mesma distribuição ou se seu sistema imunológico reconhece os antígenos da TB e se ativa, produzindo uma resposta aumentada.
Quanto ao que poderia causar um teste positivo que não seja infecção: não tenho certeza. Eu suspeito que seja tipicamente apenas variação interna nos resultados, mas certamente há uma possibilidade de outros fatores. Temos questionários a cada momento, mas ainda não os examinei muito.
* Dados fabricados, mas ilustrativos