Quais são os testes estatísticos padrão para verificar se os dados seguem distribuições exponenciais ou normais?
Quais são os testes estatísticos padrão para verificar se os dados seguem distribuições exponenciais ou normais?
Respostas:
Parece que você está tentando decidir se deseja modelar seus dados usando a distribuição normal ou a exponencial. Isso me parece um pouco estranho, pois essas distribuições são muito diferentes umas das outras.
A distribuição normal é simétrica, enquanto a distribuição exponencial é fortemente inclinada para a direita, sem valores negativos. Normalmente, uma amostra da distribuição exponencial conterá muitas observações relativamente próximas de e algumas observações que se desviam muito para a direita de . Essa diferença geralmente é fácil de ver graficamente.
Aqui está um exemplo em que simulei observações de uma distribuição normal com média e variância e uma distribuição exponencial com média e variância :2 4 2 4
A simetria da distribuição normal e a assimetria do exponencial podem ser vistas usando histogramas, gráficos de caixa e gráficos de dispersão, conforme ilustrado na figura acima.
Outra ferramenta muito útil é um gráfico QQ . No exemplo abaixo, os pontos devem seguir aproximadamente a linha se a amostra vier de uma distribuição normal. Como você pode ver, esse é o caso dos dados normais, mas não dos dados exponenciais.
Se, por algum motivo, o exame gráfico não for suficiente, você ainda poderá usar um teste para determinar se sua distribuição é normal ou exponencial. Como a distribuição normal é uma família de escala e localização, convém usar um teste invariável sob alterações de escala e localização (ou seja, o resultado do teste não deve mudar se você alterar suas medidas de polegadas para centímetros ou adicionar a todas as suas observações).
ˉ x x(1)s
Este teste é na verdade uma versão unilateral do teste de Grubbs para discrepâncias . Você encontrará isso implementado na maioria dos softwares estatísticos (mas certifique-se de usar a versão correta - existem várias estatísticas de teste alternativas usadas para o teste outlier!).
Veja KC Kapur e LR Lamberson Confiabilidade no projeto de engenharia . Wiley 1977.
Por normalidade, Anderson-Darling e Shapiro-Wilk são considerados os melhores. Para o teste exponencial de Lillerfors, foi projetado especificamente para ele.
Você já considerou métodos gráficos para ver como os dados se comportam?
As técnicas dos gráficos de probabilidade geralmente envolvem a classificação dos dados, a aplicação do CDF inverso e a plotagem dos resultados no plano cartesiano. Isso permite que você veja se vários valores se desviam da distribuição hipotética e possivelmente explicam o motivo do desvio.