Respostas:
Neste caso, é possível recolher os seus dados a
Se encaixa no modelo (onde g é a nossa função de ligação) veremos que β 0 é a logit da proporção de sucessos quando x i = 0 e p 0 + β 1 é a logit da proporção de sucessos quando . Em outras palavras, β 0 = g ( S 01 e β 0+ β 1=g(S11
Vamos verificar isso R
.
n <- 54
set.seed(123)
x <- rbinom(n, 1, .4)
y <- rbinom(n, 1, .6)
tbl <- table(x=x,y=y)
mod <- glm(y ~ x, family=binomial())
# all the same at 0.5757576
binomial()$linkinv( mod$coef[1])
mean(y[x == 0])
tbl[1,2] / sum(tbl[1,])
# all the same at 0.5714286
binomial()$linkinv( mod$coef[1] + mod$coef[2])
mean(y[x == 1])
tbl[2,2] / sum(tbl[2,])
Portanto, os coeficientes de regressão logística são exatamente transformações de proporções vindas da tabela.
O resultado é que certamente podemos analisar esse conjunto de dados com uma regressão logística se tivermos dados provenientes de uma série de variáveis aleatórias de Bernoulli, mas isso não é diferente de analisar diretamente a tabela de contingência resultante.
Quando você tem mais de um preditores e todos os preditores são variáveis binárias, você pode ajustar um modelo usando a Regressão Lógica [1] (observe que é "Lógica" e não "Logística"). É útil quando você acredita que os efeitos de interação entre seus preditores são importantes. Há uma implementação no R ( LogicReg
pacote).
[1] Ruczinski, I., Kooperberg, C., & LeBlanc, M. (2003). Regressão lógica. Jornal de Estatísticas Computacionais e Gráficas, 12 (3), 475-511.