Intervalos de significância e credibilidade para o termo de interação em regressão logística


8

Eu ajustei uma regressão logística bayesiana no WinBugs e ele tem um termo de interação. Algo assim:

Prob(yi=1)=logit1(a+b1xi+b2wi+b3xiwi)

onde é uma variável contínua padronizada é uma variável dummy. Na realidade, o modelo é mais complicado, mas quero manter as coisas simples.xw

Acontece que o termo de interação é "significativo", mas não os únicos preditores. Por exemplo,

mean(b1)=.2 e quantil : e95(1.3.7)

mean(b2)=.4 e quantil : e95(1.3.5)

mean(b3)=1.4 e quantil: e95(.42.5)

Vocês têm algum conselho sobre como reagir a essa descoberta? Eu pensei que poderia calcular intervalos de credibilidade de 95% para todo o efeito de quando . Isso seria: quantil de 95% para o efeito total de x, condicional em : exw=1w=1(1.3+.4.7+2.5)=(.9+3.2)

Isso está correto? Caso contrário, o que devo fazer? Alguma referência sobre o assunto?

Respostas:


5

Não, seu cálculo não está correto, porque:

a) e provavelmente estão correlacionados na distribuição posterior, eb1b3

b) mesmo que não fossem, não é assim que você calcularia (pense na lei dos grandes números).

Mas não tenha medo, existe uma maneira muito fácil de fazer isso no WinBUGS. Basta definir uma nova variável:

b1b3 <- b1 + b3

e monitorar seus valores.

EDITAR:

Para uma melhor explicação do meu primeiro ponto, suponha que o posterior tenha uma distribuição normal multivariada conjunta (não terá neste caso, mas serve como uma ilustração útil). Então o parâmetro tem distribuição e, portanto, o intervalo de 95% credível é - observe que isso depende apenas da média e variação.biN(μi,σi2)(μi1.96σi,μi+1.96σi)

Agora terá distribuição . Observe que o termo de variação (e, portanto, o intervalo confiável de 95%) envolve o termo de correlação que não pode ser encontrado nos intervalos de ou .b1+b3N(μ1+μ3,σ12+2ρ13σ1σ3+σ32)ρ13b1b3

(Meu argumento sobre a lei dos grandes números foi justamente que os desvios padrão da soma de 2 variáveis ​​aleatórias independentes são menores que a soma dos desvios padrão.)

Quanto à forma de implementá-lo no WinBUGS, algo como isto é o que eu tinha em mente:

model {
  a ~ dXXXX
  b1 ~ dXXXX
  b2 ~ dXXXX
  b3 ~ dXXXX
  b1b3 <- b1 + b3

  for (i in 1:N) {
    logit(p[i]) <- a + b1*x[i] + b2*w[i] + b3*x[i]*w[i]
    y[i] ~ dbern(p[i])
  }
}

Em cada etapa do amostrador, o nó b1b3será atualizado de b1e b3. Ele não precisa de um prior, pois é apenas uma função determinística de dois outros nós.


Não sei se entendi seu commnet. Se b1 e b3 estão correlacionados, por que isso importa? Quero dizer, sua distribuição conjunta deve ser caracterizada com algum parâmetro de correlação, mas e daí? Eu tenho suas distribuições marginais. 2. Não entendi que você mencionou a lei dos grandes números. Você poderia expandir isso? Finalmente, você está sugerindo que eu deveria adicionar b1 + b3 no loop principal? E eu só preciso usar um vago antes deste novo parâmetro? Obrigado!
Manoel Galdino 30/06

1

Algumas reflexões: 1) Não sei se o fato de ser bayesiano é importante. 2) Acho que sua abordagem está correta 3) Interações na regressão logística são complicadas. Escrevi sobre isso em um artigo sobre SAS PROC LOGISTIC, mas a ideia geral é válida. Esse artigo está no meu blog e está disponível aqui


Concordo que é provável que bayesiano ou não não importe. Acabei de dizer que era bayesiano, apenas para o caso.
Manoel Galdino

1

Atualmente, estou tendo um problema semelhante. Eu também acredito que a abordagem para calcular o efeito total de w está correta. Eu acredito que isso pode ser testado via

h0: b2 + b3 * médio (x) = 0; ha: b2 + b3 * médio (x)! = 0

No entanto, deparei-me com um artigo de Ai / Norton, que afirma que "a magnitude do efeito de interação em modelos não lineares não é igual ao efeito marginal do termo de interação, pode ser de sinal oposto e sua significância estatística não é calculada por software padrão ". (2003, p. 123)

Então, talvez você deva tentar aplicar suas fórmulas. (E se você entender como fazer isso, por favor, me diga.)

PS. Isso parece assemelhar-se ao teste de chow para regressões logísticas. Alfred DeMaris (2004, p. 283) descreve um teste para isso.

Referências:

Ai, Chunrong / Norton, Edward (2003): Termos de interação em modelos logit e probit, Economic Letters 80, p. 123-129

DeMaris, Alfred (2004): Regressão com dados sociais: modelando variáveis ​​de resposta contínua e limitada. John Wiley & Sons, Inc., Hoboken, NJ


Obrigado pela referência. Vou dar uma olhada e informar aqui se fizer algum progresso no assunto. Em relação ao seu teste sugerido, acho que não fará o trabalho. Lembre-se primeiro de que a interação é bidirecional, de x com w e w com x. Com isso, quero dizer que, mesmo que h0 seja verdadeiro, ainda é possível dizer h2: b1 + b2 * mean (w) não é zero. Além disso, em geral sei antecipadamente que a hipótese nula é falsa, ou seja, em geral não existe um efeito zero. Com uma amostra grande o suficiente, posso encontrar qualquer efeito significativo.
Manoel Galdino

E outro ponto. Mesmo que h0 e h2 sejam verdadeiros, ainda é possível dizer h3: b2 + b3 * (média (x) + sd (x))! = 0. Em outras palavras, devemos testar não apenas a média de x (ou w), mas para toda a distribuição de valores, uma vez que um terma de interação é uma maneira de dizer que o efeito preditivo varia de acordo com subgrupos de preditores.
Manoel Galdino

Eu não entendo completamente o que você quer dizer. Ao testar se b2 + b3 * significa (x) == 0, você sempre compara com alguma estatística de teste para determinar se o resultado é significativamente diferente de zero, o desvio padrão de x não é o único fator relevante.
mzuba

Sobre o que você disse ... Também não tenho certeza se entendo completamente. De qualquer forma, um dos meus pontos foi: mesmo que não rejeitemos a hipótese nula de que b2 + b3 * significa (x) == 0, significa apenas que não podemos dizer que o efeito médio de W, condicional à valores médios de x, não é zero. No entanto, o ponto principal de um termo de interação é porque queremos condicionar o efeito de W não apenas na média x, mas em toda a distribuição de x!
Manoel Galdino

Bem. Eu vejo o que você quer dizer. (O inglês também não é minha língua materna.) Acredito que o que você escreveu é verdadeiro e é também por isso que a Ai / Norton plota o efeito de interação contra toda a distribuição do prob (x) - para alguns valores de x, o efeito de interação é positivo, para alguns outros, não é. No entanto, acredito que o fato de você calcular o efeito de W, que é um manequim, pode (?) Facilitar as coisas, porque pode ser interpretado como teste de comida, quebra estrutural, subpopulação etc. (Deseja calcular o passo-efeito de w 0 → 1, ou você está interessado no efeito de interação)?
mzuba
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.