dispersão em summary.glm ()

13

Eu conduzi um glm.nb por

glm1<-glm.nb(x~factor(group))

sendo o grupo uma categoria c e x uma variável métrica. Quando tento obter o resumo dos resultados, obtenho resultados ligeiramente diferentes, dependendo se uso summary()ou nãosummary.glm . summary(glm1)me dá

    ...
Coefficients:
                    Estimate Std. Error z value Pr(>|z|)  
    (Intercept)       0.1044     0.1519   0.687   0.4921  
    factor(gruppe)2   0.1580     0.2117   0.746   0.4555  
    factor(gruppe)3   0.3531     0.2085   1.693   0.0904 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 1)

Considerando que summary.glm (glm1) me fornece

    ...
Coefficients:
                    Estimate Std. Error t value Pr(>|t|)  
    (Intercept)       0.1044     0.1481   0.705   0.4817  
    factor(gruppe)2   0.1580     0.2065   0.765   0.4447  
    factor(gruppe)3   0.3531     0.2033   1.737   0.0835 .
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

    (Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067)

Entendo o significado do parâmetro dispersão, mas não da linha

(Dispersion parameter for Negative Binomial(0.7109) family taken to be 0.9509067).

No manual diz que seria a dispersão estimada, mas parece uma estimativa ruim, pois 0,95 não está próximo de 0,7109 ou a dispersão estimada é algo diferente do parâmetro de dispersão estimado? Acho que preciso definir a dispersão em summary.nb(x, dispersion=)algo, mas não tenho certeza se devo definir a dispersão como 1 (o que produzirá o mesmo resultado summary()ou se devo inserir uma estimativa do parâmetro de dispersão, neste caso, levando a summary.nb(glm1, dispersion=0.7109)ou algo mais? Ou estou bem apenas usando o summary(glm1)?

r generalized-linear-model negative-binomial

— Renoir Pulitz
fonte

2

Use summary () conforme ele é enviado para o método S3 apropriado para a classe negbin. É claro que a dispersão deve ser 1, o que é estimado é teta, que é melhor chamado de parâmetro de forma para evitar confusão. Veja também stats.stackexchange.com/questions/27773/how-does-glm-nb-work/…

— Momo

13

summary.glm"negbin"summary.glmdispersionsummary.glm glm $\phi$ $\phi$ familyglm.nb"Negative Binomial(theta)"summary.glmno modelo montado por glm.nb, no código

if (is.null(dispersion)) 
    dispersion <- if (object$family$family %in% c("poisson", 
        "binomial")) 
        1
    else if (df.r > 0) {
        est.disp <- TRUE
        if (any(object$weights == 0)) 
                warning("observations with zero weight not used for calculating dispersion")
            sum((object$weights * object$residuals^2)[object$weights > 
            0])/df.r
    }

"poisson""binomial" $\phi$ summary.negbin

$\phi$ dispersion

Em segundo lugar, você entende mal a saída. Quando você vê

Negative Binomial(0.7109)

$\hat{\theta}$ $\phi$

$\phi$ $\phi = 1$ summary.negbin

summary(glm1, dispersion = 0.9509)

negbin $\phi$

— Restabelecer Monica - G. Simpson
fonte

5

+1 boa explicação. Tenho dois pequenos comentários: O parâmetro de dispersão em binomial, Poisson e binomial negativo com parâmetro de forma conhecido é 1 por definição da família exponencial (não é uma suposição). Quando você diz que uma dispersão diferente pode ser estimada e fornecida ao método de resumo, deve-se ter cuidado, pois se aventuraria em um território quase que tem implicações, especialmente para a probabilidade.

— Momo

@Momo Bem dito. Fiquei dividido entre o que você declara e os detalhes da página de ajuda para as respectivas funções.

— Reinstate Monica - G. Simpson

2

$\theta$ $\frac{1}{\theta}$ $1$ $\frac{1}{\theta}$ $E$ $Y$ $E$ $\mu E$ $\mu$ é uma função dos preditores e coeficientes, dependendo da sua escolha de link. Marginalmente, sua distribuição é binomial negativa, com função de massa

f (y) = \frac{Γ (θ + y)}{Γ (θ) y!} \cdot \frac{μ^{y} θ^{θ}}{(μ + θ)^{θ + y}}

$f(y)=\frac{\Gamma(\theta +y)}{\Gamma(\theta) y!}\cdot\frac{\mu^y \theta^\theta}{(\mu+\theta)^{\theta+y}}$

expectativa

E Y = μ

$\operatorname{E}Y=\mu$

& variação

Var Y = μ + \frac{μ^{2}}{θ}

$\operatorname{Var} Y = \mu +\frac{\mu^2}{\theta}$

Como o @Momo aponta, o parâmetro de dispersão é outra coisa completamente diferente, que você deixaria variar para fazer uma estimativa de quase-probabilidade. Para o modelo binomial negativo e o modelo de Poisson (verdadeiro), é corretamente fixado em um valor de um.

— Scortchi - Restabelecer Monica
fonte