Atualmente, estou trabalhando com um grande conjunto de dados de solicitações de seguro de saúde que inclui algumas solicitações de laboratório e farmácia. As informações mais consistentes no conjunto de dados, no entanto, são compostas por códigos de diagnóstico (CID-9CM) e procedimentos (CPT, HCSPCS, CID-9CM).
Meus objetivos são:
- Identifique as condições precursoras mais influentes (comorbidades) para uma condição médica como doença renal crônica;
- Identifique a probabilidade (ou probabilidade) de um paciente desenvolver uma condição médica com base nas condições que teve no passado;
- Faça o mesmo que 1 e 2, mas com procedimentos e / ou diagnósticos.
- De preferência, os resultados seriam interpretáveis por um médico
Analisei coisas como os documentos do Marco de Prêmio de Saúde do Patrimônio e aprendi muito com eles, mas eles estão focados na previsão de hospitalizações.
Então, aqui estão minhas perguntas: Quais métodos você acha que funcionam bem para problemas como esse? E que recursos seriam mais úteis para aprender sobre aplicativos e métodos de ciência de dados relevantes para a saúde e a medicina clínica?
EDIT # 2 para adicionar tabela de texto sem formatação:
A DRC é a condição de destino, "doença renal crônica", ".any" indica que eles adquiriram essa condição a qualquer momento, ".isbefore.ckd" significa que eles tinham essa condição antes do primeiro diagnóstico de DRC. As outras abreviações correspondem a outras condições identificadas pelos agrupamentos de códigos da CID-9CM. Esse agrupamento ocorre no SQL durante o processo de importação. Cada variável, com exceção da Patient_age, é binária.