Pearson VS Deviance Residuals em regressão logística


16

Eu sei que os Pearson Residuals padronizados são obtidos de uma maneira probabilística tradicional:

ri=yiπiπi(1πi)

Residuais de Deviance e Deviance são obtidos de uma maneira mais estatística (a contribuição de cada ponto para a probabilidade):

di=si2[yilogπi^+(1yi)log(1πi)]

onde = 1 se y i = 1 e s i = -1 se = 0.siyisiyi

Você pode me explicar, intuitivamente, como interpretar a fórmula dos resíduos de desvio?

Além disso, se eu quiser escolher um, qual é o mais adequado e por quê?

BTW, algumas referências afirmam que derivamos os resíduos de desvio com base no termo

12ri2

onde é mencionado acima.ri


Qualquer pensamento seria apreciada
Jack Shi

1
Quando você diz "algumas referências" ... quais referências e como elas fazem isso?
Glen_b -Reinstala Monica

Respostas:


10

A regressão logística busca maximizar a função de probabilidade de log

LL=kln(Pi)+rln(1Pi)

onde é a probabilidade prevista nesse caso i é Y = 1 ; k é o número de casos observados como Y = 1 e r é o número de casos (o resto) observados como Y = 0 .PiY^=1kY=1rY=0

Essa expressão é igual a

LL=(kdi2+rdi2)/2

porque o desvio de desvio de um caso é definido como:

di={2ln(Pi)if Yi=12ln(1Pi)if Yi=0

Assim, a regressão logística binária busca diretamente minimizar a soma dos resíduos do desvio ao quadrado. São os resíduos de desvio que estão implícitos no algoritmo ML da regressão.

2(LLfull modelLLreduced model)

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.