Quais propriedades úteis a função de link canônico possui?

8

Então, aqui estou estudando modelos lineares generalizados. Sei que essa pergunta é bastante ingênua e simples, mas não sei exatamente por que a função canônica do link é tão útil. Alguém poderia me fornecer uma intuição sobre esse problema?

— user1337
fonte

8

Eu sei que essa pergunta é bastante ingênua e simples, mas não sei exatamente por que a função canônica do link é tão útil

É realmente tão útil? Uma função de link sendo canônica é principalmente uma propriedade matemática. Isso simplifica um pouco a matemática, mas na modelagem você deve usar a função de link que é cientificamente significativa.

Então, quais propriedades extras uma função de link canônico possui?

Isso leva à existência de estatísticas suficientes. Talvez isso implique uma estimativa um pouco mais eficiente, mas o software moderno (como glmno R) parece não tratar os links canônicos de maneira diferente dos outros links.
Ele simplifica algumas fórmulas, facilitando o desenvolvimento teórico. Muitas boas propriedades matemáticas, consulte Qual é a diferença entre uma "função de link" e uma "função de link canônico" para GLM .

Portanto, as vantagens parecem ser principalmente matemáticas e algorítmicas, não realmente estatísticas.

Mais alguns detalhes: Seja $Y_1, \dotsc, Y_n$ observações independentes do modelo da família de dispersão exponencial

f_{Y} (y; θ, ϕ) = \exp {(y θ - b (θ)) / uma (ϕ) + c (y, ϕ)}

$f_Y(y;\theta,\phi)=\exp\left\{(y\theta-b(\theta))/a(\phi) + c(y,\phi)\right\}$ com expectativa

E Y_{i} = μ_{i}

$\DeclareMathOperator{\E}{\mathbb{E}} \E Y_i=\mu_i$ preditor linear

η_{i} = x_{i}^{T} β

$\eta_i = x_i^T \beta$ com vetor covariado

x_{i}

$x_i$ . A função de link é canônica se

η_{i} = θ_{i}

$\eta_i=\theta_i$ . Neste caso, a função de probabilidade pode ser expressa como

L (β; ϕ) = \exp {\sum_{i} \frac{y_{i} x_{i}^{T} β - b (x_{i}^{T} β)}{a (ϕ)} + \sum_{i} c (y_{i}, ϕ)}

$\mathcal{L}(\beta; \phi)=\exp\left\{ \sum_i \frac{y_i x_i^T \beta -b(x_i^T \beta)}{a(\phi)}+\sum_i c(y_i,\phi)\right\}$ e peloteoremadafatoraçãopodemos concluir que

\sum_{i} x_{i} y_{i}

$\sum_i x_i y_i$ é suficiente para

β

$\beta$ .

Sem entrar em detalhes, as equações necessárias para o IRLS serão simplificadas. Da mesma forma, essa pesquisa no Google parece principalmente encontrar links canônicos mencionados no contexto de simplificações, e não mais razões estatísticas.

— kjetil b halvorsen
fonte

É matematicamente útil, talvez.

— AdamO 23/05/19

Sim, é o que eu tentei dizer!

— Kjetil b halvorsen

7

A função de link canônico descreve a relação de variação média em um GLM. Por exemplo, uma variável aleatória binomial tem a função de link $\mu = \exp( \nu) /(1-\exp(\nu))$ onde $\nu$ é um preditor linear $\mathbf{X}^T\beta$ . Observe que $\frac{\partial }{\partial \nu} \mu = \mu(1-\mu)$ que é a relação de variação média apropriada para uma variável aleatória de Bernoulli. O mesmo se aplica às variáveis aleatórias de Poisson, em que a função de link inverso é $\mu = \exp(\nu)$ e $\frac{\partial }{\partial \nu} \mu = \mu$ onde, em uma variável aleatória de Poisson, a variação é a média.

O modelo linear generalizado resolve uma equação de estimativa da forma:

S (β) = D V^{- 1} (Y - g (X^{T} β))

$S(\beta) = D V^{-1} (Y - g(\mathbf{X}^T\beta))$

$D = \frac{\partial}{\partial \beta} g(\mathbf{X}^T\beta)$ $V=\text{var}(Y)$ $D = V$

S (β) = X^{T} (Y - g (X^{T} β))

$S(\beta) = \mathbf{X}^{T}(Y - g(\mathbf{X}^T\beta))$

Como foi observado no artigo de Wedderburn, de 1976, sobre a quase-probabilidade, o link canônico tem a vantagem de que as informações esperadas e observadas são as mesmas e que os mínimos quadrados com ponderação iterativa são equivalentes a Newton-Raphson, portanto, isso simplifica os procedimentos de estimativa e a estimativa de variância.

— AdamO
fonte