dispersão em summary.glm ()


13

Eu conduzi um glm.nb por

glm1<-glm.nb(x~factor(group))

sendo o grupo uma categoria c e x uma variável métrica. Quando tento obter o resumo dos resultados, obtenho resultados ligeiramente diferentes, dependendo se uso summary()ou nãosummary.glm . summary(glm1)me dá

    ...
Coefficients:
                    Estimate Std. Error z value Pr(>|z|)  
    (Intercept)       0.1044     0.1519   0.687   0.4921  
    factor(gruppe)2   0.1580     0.2117   0.746   0.4555  
    factor(gruppe)3   0.3531     0.2085   1.693   0.0904 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 1)

Considerando que summary.glm (glm1) me fornece

    ...
Coefficients:
                    Estimate Std. Error t value Pr(>|t|)  
    (Intercept)       0.1044     0.1481   0.705   0.4817  
    factor(gruppe)2   0.1580     0.2065   0.765   0.4447  
    factor(gruppe)3   0.3531     0.2033   1.737   0.0835 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1   1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)

Entendo o significado do parâmetro dispersão, mas não da linha

(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067).

No manual diz que seria a dispersão estimada, mas parece uma estimativa ruim, pois 0,95 não está próximo de 0,7109 ou a dispersão estimada é algo diferente do parâmetro de dispersão estimado? Acho que preciso definir a dispersão em summary.nb(x, dispersion=)algo, mas não tenho certeza se devo definir a dispersão como 1 (o que produzirá o mesmo resultado summary()ou se devo inserir uma estimativa do parâmetro de dispersão, neste caso, levando a summary.nb(glm1, dispersion=0.7109)ou algo mais? Ou estou bem apenas usando o summary(glm1)?


2
Use summary () conforme ele é enviado para o método S3 apropriado para a classe negbin. É claro que a dispersão deve ser 1, o que é estimado é teta, que é melhor chamado de parâmetro de forma para evitar confusão. Veja também stats.stackexchange.com/questions/27773/how-does-glm-nb-work/…
Momo

Respostas:


13

summary.glm"negbin"summary.glmdispersionsummary.glm glmϕϕfamilyglm.nb"Negative Binomial(theta)"summary.glmno modelo montado por glm.nb, no código

if (is.null(dispersion)) 
    dispersion <- if (object$family$family %in% c("poisson", 
        "binomial")) 
        1
    else if (df.r > 0) {
        est.disp <- TRUE
        if (any(object$weights == 0)) 
                warning("observations with zero weight not used for calculating dispersion")
            sum((object$weights * object$residuals^2)[object$weights > 
            0])/df.r
    }

"poisson""binomial"ϕsummary.negbin

ϕdispersion

Em segundo lugar, você entende mal a saída. Quando você vê

Negative Binomial(0.7109)

θ^ϕ

ϕϕ=1summary.negbin

summary(glm1, dispersion = 0.9509)

negbinϕ


5
+1 boa explicação. Tenho dois pequenos comentários: O parâmetro de dispersão em binomial, Poisson e binomial negativo com parâmetro de forma conhecido é 1 por definição da família exponencial (não é uma suposição). Quando você diz que uma dispersão diferente pode ser estimada e fornecida ao método de resumo, deve-se ter cuidado, pois se aventuraria em um território quase que tem implicações, especialmente para a probabilidade.
Momo

@Momo Bem dito. Fiquei dividido entre o que você declara e os detalhes da página de ajuda para as respectivas funções.
Reinstate Monica - G. Simpson

2

θ1θ11θEYEμEμ é uma função dos preditores e coeficientes, dependendo da sua escolha de link. Marginalmente, sua distribuição é binomial negativa, com função de massa

f(y)=Γ(θ+y)Γ(θ)y!μyθθ(μ+θ)θ+y

expectativa

EY=μ

& variação

VarY=μ+μ2θ

Como o @Momo aponta, o parâmetro de dispersão é outra coisa completamente diferente, que você deixaria variar para fazer uma estimativa de quase-probabilidade. Para o modelo binomial negativo e o modelo de Poisson (verdadeiro), é corretamente fixado em um valor de um.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.