Ponderação do escore de propensão na análise de Cox Cox e seleção covariável


11

Em relação à ponderação do escore de propensão (IPTW) ao fazer a modelagem de risco proporcional de Cox dos dados de sobrevivência de tempo para evento:

Tenho dados prospectivos de registro nos quais estamos interessados ​​em analisar o efeito do tratamento de um medicamento que, na maioria dos casos, os pacientes já estavam tomando no início. Portanto, não sei como melhor analisar os dados. Potencialmente, algumas das variáveis ​​de linha de base são em grande parte influenciadas pelo tratamento e não o contrário (por exemplo, certos biomarcadores). Estou um pouco perdido quanto a quais covariáveis ​​devo incluir no modelo de pontuação de propensão para estimar pesos e quais covariáveis ​​devo incluir como covariáveis ​​no coxphmodelo (se houver). Qualquer dica na direção certa seria útil! Ainda não encontrei nenhuma literatura sobre isso na modelagem CoxPh.

Penso que covariáveis ​​que representam tratamentos instituídos na linha de base que (possam) influenciar o resultado devem ser incluídos como covariáveis ​​de Cox PH, mas não tenho certeza disso.

Como determino quais variáveis ​​devem ser incluídas como covariáveis ​​no modelo Cox em vez de serem usadas no cálculo dos pesos do escore de propensão?


Questão a seguir:

Entendo o problema hereditário de avaliar o efeito do tratamento de uma certa intervenção que já começou - ou seja, prevalece entre os pacientes, antes do início da observação. Tanto no que diz respeito à introdução de viés relacionado à variação temporal do risco (por exemplo, efeitos colaterais adversos mais comuns no primeiro ano de terapia) quanto às covariáveis ​​afetadas pelo tratamento. Se não me engano - isso foi proposto como uma causa de discrepância entre observacional e aleatório em relação aos parâmetros cardiovasculares e terapia de reposição hormonal. No meu conjunto de dados, por outro lado, estamos interessados ​​em observar um possível efeito adverso do tratamento.

Se eu usar o ajuste do escore de propensão para investigar o efeito do tratamento entre os usuários prevalentes, ou seja, já usar o medicamento antes do início da observação, nos dados da coorte e observarmos um efeito adverso de uma terapia farmacológica (e é isso que estávamos procurando). Posso descartar a possibilidade de superestimar o risco associado ao tratamento? Ou seja, desde que o risco seja significativamente elevado, é mais "definitivamente" não protetor.

Não consigo imaginar um exemplo em que esse tipo de viés possa introduzir uma superestimação do risco de associação de risco falso nesse contexto.

Respostas:


9

Em teoria, todas as variáveis ​​que você selecionar como parte do peso do escore de propensão não precisam ser incluídas como covariáveis ​​no modelo, porque a ponderação já controlou seu potencial de confusão. Com um modelo de ponderação adequado, você pode, literalmente, apenas modelar o efeito da exposição.

Dito isto, há razões pelas quais você pode querer incluir termos no modelo:

  • Estimativas "duplamente robustas". Não há razão, exceto pela perda de precisão, de que você não pode usar variáveis ​​no modelo de ponderação e como covariáveis. Em teoria, você está se protegendo contra confusão de duas maneiras (portanto, essa técnica é referida como "duplamente robusta"). Lembre-se de que isso apenas protege você contra o modelo PS ou o modelo covariável que está sendo especificado incorretamente, fornecendo uma "segunda chance" para especificar o modelo correto, não é uma solução mágica.
  • Várias estimativas de interesse. A ponderação faz desaparecer as estimativas de efeito das covariáveis ​​- se você deseja um coeficiente de regressão para a variável, inclua-o como covariável na etapa CoxPH e não no modelo PS.

Tente pesquisar por termos "Duplamente robustos" e similares em periódicos como Epidemiology ou The American Journal of Epidemiology , bem como na literatura bioestatística, e você deve descobrir algumas fontes úteis.


Obrigado por uma resposta (rápida) e clara! Eu já vi duplamente robusto sendo mencionado, mas vi muito a sério. Eu definitivamente vou agora. Você diria que o uso de estimativas duplamente robustas é garantido quando as covariáveis ​​não são ajustadas adequadamente após a ponderação (por exemplo) ainda diferenças significativas entre os grupos de tratamento?
Kjetil Loland

11
@KjetilLoland Essa pode ser uma razão para usar estimativas duplamente robustas - geralmente, é algo para se olhar sempre que você estiver preocupado com o fato de um método para controlar variáveis ​​estar sofrendo de especificação incorreta. Eu também verificaria se o seu modelo de PS não está funcionando e está fornecendo boas e sobrepostas pontuações de propensão entre os dois grupos.
fomite

11
Devido à não recolhibilidade da taxa de risco, não é adequado incluir apenas as variáveis ​​no PS. É comum deixar que o PS inclua a "pia da cozinha" e que os preditores mais importantes sejam incluídos novamente como covariáveis. Isso impedirá a subestimação da taxa de perigos da exposição.
precisa saber é o seguinte

Mais uma vez, obrigado a @EpiGrad e Frank por suas respostas. Não posso dizer exatamente que os grupos de tratamento tenham boas e sobrepostas pontuações de propensão. Então, eu provavelmente acabaria usando um amplo ajuste covariável. Em uma nota lateral, notei que escrevi IPTW, quando na verdade estou usando o pacote twang - que utiliza regressão impulsionada generalizada para estimar pesos (se eu estiver certo) - mas acho que isso não muda a abordagem geral Muito de.
precisa saber é o seguinte

@KjetilLoland Você pode pelo menos inspecionar visualmente se suas pontuações no PS se sobrepõem ou não, observando as parcelas sobrepostas de sua distribuição por grupo de tratamento.
fomite

3

É importante distinguir "afetado pelo tratamento" e "relacionado ao tratamento". O último pode incluir fatores de seleção de tratamento, como os que estamos tentando ajustar com propensão e / ou ajuste covariável. "Afetados pelo tratamento" implica que as covariáveis ​​são medidas após o tempo zero (por exemplo, após a randomização ou após o início do tratamento), o que significa que raramente devem ser usadas.


Mais uma vez obrigado Dr. Harrell. Algumas de nossas variáveis ​​são definitivamente "afetadas pelo tratamento". O tratamento que estamos tentando investigar foi iniciado antes da linha de base, o que obviamente não é ideal. Se o ajuste do escore de propensão é ou não adequado para esse tipo de análise é talvez uma pergunta melhor. No entanto, não conheço outra maneira de investigar isso.
Kjetil Loland

O desenho do estudo pode não ser adequado ao que você deseja fazer. O estudo será muito difícil de interpretar. Você pode solicitar que especialistas no assunto tentem criar um subconjunto de variáveis ​​que provavelmente não mudam com o tratamento, mas o ajuste para confundir por implicação pode estar incompleto.
precisa

Eu vejo. Acho que isso começa a parecer um pouco com os velhos estudos observacionais versus randomizados da TRH sobre DCV. Corrija-me se estiver errado, mas não é tudo o que "arrisco" para subestimar o risco de um possível efeito adverso do tratamento (que é o que estamos procurando) - ou seja, desde que demonstremos que o tratamento é adverso, esse tipo de confusão só poderia enfraquecer a descoberta? Atualizei a pergunta de acordo.
precisa saber é o seguinte

2
Isso é mais do que uma questão observacional versus aleatória, mas existe uma relação com os estudos de TRH. Você pode estar certo de que algum raciocínio cuidadoso pode justificar o tratamento dos resultados como um limite inferior.
precisa
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.