Se você verificar as referências abaixo, encontrará bastante variação em segundo plano, embora existam alguns elementos comuns.
Esses números são pelo menos parcialmente baseados em alguns comentários de Fisher, onde ele disse
(enquanto discute um nível de 1/20)
É conveniente considerar esse ponto como um limite ao julgar se um desvio deve ser considerado significativo ou não. Desvios superiores ao dobro do desvio padrão são formalmente considerados significativos
Fisher, RA (1925) Métodos Estatísticos para Pesquisadores , p. 47
Por outro lado, ele às vezes era mais amplo:
Se um em cada vinte não parece ter probabilidades suficientemente altas, podemos, se preferirmos, traçar a linha em um em cinquenta (o ponto de 2%) ou em uma em cem (o ponto de 1%). Pessoalmente, o escritor prefere estabelecer um baixo padrão de significância no ponto de 5% e ignora inteiramente todos os resultados que não atingem esse nível. Um fato científico deve ser considerado experimentalmente estabelecido apenas se um experimento adequadamente projetado raramente falhar em fornecer esse nível de significância.
Fisher, RA (1926)
A disposição de experiências de campo . Revista do Ministério da Agricultura, p. 504
Fisher também usou 5% para uma das tabelas de seu livro - mas a maioria das outras tabelas tinha uma variedade maior de níveis de significância
Alguns de seus comentários sugeriram abordagens mais ou menos rigorosas (isto é, níveis alfa mais altos ou mais baixos) em diferentes situações.
Esse tipo de discussão acima levou a uma tendência de produzir tabelas com níveis de significância de 5% e 1% (e algumas vezes com outras, como 10%, 2% e 0,5%), por falta de outros valores 'padrão'.
No entanto, neste artigo , Cowles e Davis sugerem que o uso de 5% - ou algo parecido com isso, pelo menos - remonta ao comentário de Fisher.
Em resumo, nosso uso de 5% (e em menor grau 1%) é uma convenção arbitrária, embora claramente muitas pessoas pareçam sentir que, por muitos problemas, estão no tipo certo de estádio.
Não há razão para que um valor específico deva ser usado em geral.
Referências adicionais:
Dallal, Gerard E. (2012). O pequeno manual de prática estatística. -
Por que 0,05?
Stigler, Stephen (dezembro de 2008). "Fisher e o nível de 5%". Chance 21 (4): 12.
disponível aqui
(Entre eles, você tem um bom histórico - parece que há um bom argumento para pensar que os níveis de significância pelo menos na estimativa geral de 5% - digamos entre 2% e 10% - foram mais ou menos por um tempo.)