Wilk, MB e Gnanadesikan, R. 1968. Métodos de plotagem de probabilidade para a análise de dados.
Biometrika 55: 1-17. Link Jstor se você tiver acesso
Este artigo tem quase 50 anos, mas ainda parece novo e inovador. Usando uma rica variedade de exemplos interessantes e substanciais, os autores unificam e ampliam uma variedade de idéias para plotar e comparar distribuições usando a estrutura de gráficos QQ (quantil-quantile) e PP (probabilidade-probabilidade). As distribuições aqui significam amplamente qualquer conjunto de dados ou números (resíduos, contrastes, etc., etc.) que surjam em suas análises.
Versões particulares desses gráficos remontam a várias décadas, obviamente com probabilidade normal ou gráficos de pontuação normais. que são nesses termos gráficos quantil-quantil, ou seja, gráficos de quantis observados versus quantis esperados ou teóricos de uma amostra do mesmo tamanho de uma distribuição normal (gaussiana). Mas os autores mostram, de maneira modesta e confiante, que as mesmas idéias podem ser estendidas facilmente - e praticamente com a computação moderna - para examinar outros tipos de quantis e plotar os resultados automaticamente.
Os autores, então ambos no Bell Telephone Laboratories, desfrutavam de instalações de computação de ponta, e mesmo muitas universidades e instituições de pesquisa levaram uma década ou mais para se atualizar. Mesmo agora, as idéias neste artigo merecem uma aplicação mais ampla do que recebem. É um texto ou curso introdutório raro que inclui qualquer uma dessas idéias além da trama normal de QQ. Histogramas e gráficos de caixas (cada um com muita utilidade, mas, apesar disso, cada um é estranho e limitado de várias maneiras) continuam a ser os principais grampos quando são introduzidos gráficos de distribuições.
No nível pessoal, mesmo que as principais idéias deste artigo tenham sido familiares durante a maior parte da minha carreira, gosto de relê-lo a cada dois anos ou mais. Uma boa razão é o prazer pela maneira como os autores produzem idéias simples, mas poderosas, com bons exemplos com exemplos sérios. Outra boa razão é a maneira como o artigo, que é escrito de maneira concisa, sem o menor traço de bombardeio, sugere extensões das idéias principais. Mais de uma vez, redescobri reviravoltas nas idéias principais abordadas explicitamente em dicas e comentários adicionais.
Este não é apenas um artigo para aqueles especialmente interessados em gráficos estatísticos, embora, a meu ver, deva incluir todos os interessados em qualquer tipo de estatística. Promove maneiras de pensar sobre distribuições que são praticamente úteis no desenvolvimento de habilidades e idéias estatísticas de qualquer pessoa.