Respostas:
Eu sei que essa pergunta é bastante ingênua e simples, mas não sei exatamente por que a função canônica do link é tão útil
É realmente tão útil? Uma função de link sendo canônica é principalmente uma propriedade matemática. Isso simplifica um pouco a matemática, mas na modelagem você deve usar a função de link que é cientificamente significativa.
Então, quais propriedades extras uma função de link canônico possui?
Isso leva à existência de estatísticas suficientes. Talvez isso implique uma estimativa um pouco mais eficiente, mas o software moderno (como glm
no R) parece não tratar os links canônicos de maneira diferente dos outros links.
Ele simplifica algumas fórmulas, facilitando o desenvolvimento teórico. Muitas boas propriedades matemáticas, consulte Qual é a diferença entre uma "função de link" e uma "função de link canônico" para GLM .
Portanto, as vantagens parecem ser principalmente matemáticas e algorítmicas, não realmente estatísticas.
Mais alguns detalhes: Seja observações independentes do modelo da família de dispersão exponencial
Sem entrar em detalhes, as equações necessárias para o IRLS serão simplificadas. Da mesma forma, essa pesquisa no Google parece principalmente encontrar links canônicos mencionados no contexto de simplificações, e não mais razões estatísticas.
A função de link canônico descreve a relação de variação média em um GLM. Por exemplo, uma variável aleatória binomial tem a função de link onde é um preditor linear . Observe que que é a relação de variação média apropriada para uma variável aleatória de Bernoulli. O mesmo se aplica às variáveis aleatórias de Poisson, em que a função de link inverso éeonde, em uma variável aleatória de Poisson, a variação é a média.
O modelo linear generalizado resolve uma equação de estimativa da forma:
Como foi observado no artigo de Wedderburn, de 1976, sobre a quase-probabilidade, o link canônico tem a vantagem de que as informações esperadas e observadas são as mesmas e que os mínimos quadrados com ponderação iterativa são equivalentes a Newton-Raphson, portanto, isso simplifica os procedimentos de estimativa e a estimativa de variância.