Bem, há muitas razões para escolher uma distribuição de erro diferente. Mas acredito que você não sabe por que temos distribuições para variáveis em primeiro lugar. Se isso é óbvio, acredito que minha resposta é inútil para você, desculpe.
Por que as distribuições são importantes
Veja, ter distribuições nos permite considerar um modelo de forma probabilística, o que significa que podemos quantificar incertezas sobre o nosso modelo. Quando na estatística 101 aprendemos que a distribuição amostral da amostra significaX¯∼˙N( μ , σ) (assintoticamente), podemos, em uma estrutura probabilística, contar muitas coisas sobre essa estimativa, como testar hipóteses, construir intervalos de confiança.
Distribuições probabilísticas em modelos lineares e lineares generalizados
Quando em uma estrutura de modelo linear, podemos basicamente fazer o mesmo, se soubermos a distribuição do termo de erro. Por quê? Isso é resultado da combinação linear de variáveis aleatórias ( veja esta resposta ). Mas o ponto é que, quando essa estrutura probabilística está presente no modelo, podemos novamente fazer algum tipo de coisa. Mais notavelmente, além do teste de hipóteses e da construção de IC, podemos construir previsões com incerteza quantificada, seleção de modelo, qualidade dos testes de ajuste e várias outras coisas.
Agora, por que precisamos especificamente de GLMs? Primeiro, a estrutura probabilística de um modelo linear não pode lidar com diferentes tipos disso, como contagens ou dados binários. Esses tipos de dados são intrinsecamente diferentes, como dados contínuos regulares, o que significa que é possível ter uma altura de 1,83 metros, mas é inútil ter 4,5 luzes elétricas não funcionando.
Portanto, a motivação para GLMs começa com o tratamento de diferentes tipos de dados, principalmente pelo uso de funções de link ou / e pela manipulação inteligente do modelo pretendido para uma "estrutura" linear conhecida. Essas necessidades e idéias estão conectadas diretamente à forma como os erros são modelados pela "estrutura" que está sendo usada.