A gama tem uma propriedade compartilhada pelo lognormal; ou seja, quando o parâmetro de forma é mantido constante enquanto o parâmetro de escala é variado (como geralmente é usado quando se usa qualquer um dos modelos), a variação é proporcional ao quadrado médio (coeficiente de variação constante).
Algo aproximado disso ocorre com bastante frequência com dados financeiros, ou mesmo com muitos outros tipos de dados.
Como resultado, geralmente é adequado para dados que são contínuos, positivos, inclinados para a direita e onde a variação é quase constante na escala de log, embora existam várias outras opções bem conhecidas (e geralmente disponíveis com facilidade) com aquelas propriedades.
Além disso, é comum ajustar um link de log com o gama GLM (é relativamente mais raro usar o link natural). O que o torna um pouco diferente da adaptação de um modelo linear normal aos registros dos dados é que, na escala de registros, a gama é deixada inclinada em graus variados, enquanto o normal (o registro de um lognormal) é simétrico. Isso o torna (a gama) útil em várias situações.
Eu já vi usos práticos para GLMs gama discutidos (com exemplos de dados reais) em (de cabeça para baixo ) de Jong & Heller e Frees , além de vários artigos; Eu também vi aplicações em outras áreas. Ah, e se bem me lembro, o MASS de Venables e Ripley o usa no absenteísmo escolar (os dados quine; Edit: acontece que está realmente em Complementos de Estatística do MASS , veja a p11, a 14ª página do pdf, tem um link de log, mas há uma pequena mudança do DV). McCullagh e Nelder fizeram um exemplo de coagulação do sangue, embora talvez tenha sido um elo natural.
Depois, há o livro de Faraway, onde ele fez um exemplo de seguro de carro e um exemplo de dados de fabricação de semicondutores.
Existem algumas vantagens e desvantagens em escolher uma das duas opções. Desde os dias de hoje, ambos são fáceis de encaixar; geralmente é uma questão de escolher o que é mais adequado.
Está longe de ser a única opção; por exemplo, também existem GLMs gaussianos inversos, que são mais inclinados / mais pesados (e ainda mais heterocedásticos) do que gama ou normal de log.
Quanto às desvantagens, é mais difícil fazer intervalos de previsão. Algumas telas de diagnóstico são mais difíceis de interpretar. As expectativas computacionais na escala do preditor linear (geralmente na escala logarítmica) são mais difíceis do que no modelo lognormal equivalente. Testes de hipóteses e intervalos geralmente são assintóticos. Estes são frequentemente problemas relativamente menores.
Possui algumas vantagens sobre a regressão lognormal log-link (pegando logs e ajustando um modelo de regressão linear comum); uma é que a previsão média é fácil.