Isso parece tão elementar, mas eu sempre fico preso neste momento ...
A maioria dos dados com os quais eu lido não é normal e a maioria das análises é baseada em uma estrutura GLM. Para minha análise atual, tenho uma variável de resposta que é "velocidade de caminhada" (metros / minuto). É fácil para mim identificar que não posso usar o OLS, mas tenho uma grande incerteza ao decidir qual família (Gamma, Weibull etc.) é apropriada!
Uso o Stata e analiso diagnósticos como resíduos e heterocedasticidade, resíduos versus valores ajustados, etc.
Estou ciente de que os dados de contagem podem assumir a forma de uma taxa (por exemplo, taxas de incidência) e usaram gama (o analógico para modelos binomiais negativos discretos superdispersos), mas gostaria apenas que uma "arma fumegante" dissesse SIM, VOCÊ TEM O CERTO FAMÍLIA. Observar os resíduos padronizados versus os valores ajustados é a única e melhor maneira de fazer isso? Gostaria de usar um modelo misto para dar conta de alguma hierarquia nos dados, mas primeiro preciso resolver qual família melhor descreve minha variável de resposta.
Qualquer ajuda apreciada. Linguagem Stata especialmente apreciada!