No GLM, a previsão é uma função não linear do produto das covariáveis com vetor de coeficiente estimado :
Distribuição por amostra finita de é geralmente desconhecido, mas desde que seja uma estimativa de probabilidade máxima , ela possui distribuição normal assintótica , em que é a matriz hessiana da função de probabilidade em seu máximo. Os valores p defXβ^
y^=f(Xβ^)
β^β^ N(β,−H−1)Hβque são mostrados como resultado de uma regressão quase sempre se baseiam nesses assintóticos. Mas se você acha que sua amostra é muito pequena para assintóticos, use a distribuição numérica (por exemplo, inicialização).
Quando você usa uma distribuição normal assintótica de (e, portanto, ), a distribuição de ainda não é normal devido a não linear . Você pode ignorá-lo - obtenha limites de confiança normais para e conecte-os em , obtendo limites para como .β^Xβ^y^f(zlower,zupper)Xβfy(ylower,yupper)=(f(zlower),f(zupper))
Outra estratégia (chamada método delta ) é fazer uma expansão de de Taylor em torno de - será linear em . Portanto, você pode aproximar a distribuição de como
fXβ^β^f(Xβ^)
f(Xβ^)∼N(f(Xβ),−(f′(Xβ))2XH−1XT)
Então, o intervalo de confiança assintótico de 95% para pareceriaf(Xβ)
f(Xβ^)±1.96(f′(Xβ^))2XH(β^)−1XT−−−−−−−−−−−−−−−−−−√
Agora você só precisa encontrar expressão para matrizes Hessianas para modelos específicos, como regressão logística nesta questão . E esta questão apresenta uma comparação prática de bootstrap, limites normais transformados e método delta para regressão logística.