Você parece supor na sua pergunta que o conceito de distribuição normal existia antes da distribuição ser identificada e as pessoas tentaram descobrir o que era. Não está claro para mim como isso funcionaria. [Editar: há pelo menos um sentido que poderíamos considerar haver uma "busca por uma distribuição", mas não é "uma busca por uma distribuição que descreva muitos e muitos fenômenos"]
Este não é o caso; a distribuição era conhecida antes de ser chamada de distribuição normal.
como você provaria a uma pessoa que a função de densidade de probabilidade de todos os dados normalmente distribuídos tem o formato de um sino
A função de distribuição normal é aquela que costuma ser chamada de "forma de sino" - todas as distribuições normais têm a mesma "forma" (no sentido de que diferem apenas em escala e localização).
Os dados podem parecer mais ou menos "em forma de sino" na distribuição, mas isso não o torna normal. Muitas distribuições não normais parecem "em forma de sino".
As distribuições populacionais reais das quais os dados são extraídos provavelmente nunca são realmente normais, embora às vezes seja uma aproximação bastante razoável.
Isso geralmente acontece com quase todas as distribuições que aplicamos às coisas no mundo real - elas são modelos , não fatos sobre o mundo. [Como exemplo, se fizermos certas suposições (aquelas de um processo de Poisson), podemos derivar a distribuição de Poisson - uma distribuição amplamente usada. Mas essas suposições são exatamente satisfeitas? Geralmente, o melhor que podemos dizer (nas situações certas) é que elas são quase verdadeiras.]
o que realmente consideramos dados normalmente distribuídos? Dados que seguem o padrão de probabilidade de uma distribuição normal ou algo mais?
Sim, para ser realmente distribuído normalmente, a população da qual a amostra foi extraída teria que ter uma distribuição que tenha a forma funcional exata de uma distribuição normal. Como resultado, qualquer população finita não pode ser normal. Variáveis que necessariamente delimitadas não podem ser normais (por exemplo, o tempo gasto para tarefas específicas, comprimentos de determinadas coisas não podem ser negativos, portanto, na verdade, não podem ser normalmente distribuídos).
talvez seja mais intuitivo que a função de probabilidade dos dados normalmente distribuídos tenha a forma de um triângulo isósceles
Não vejo por que isso é necessariamente mais intuitivo. É certamente mais simples.
Ao desenvolver pela primeira vez modelos de distribuição de erros (especificamente para astronomia no período inicial), os matemáticos consideraram uma variedade de formas em relação às distribuições de erros (incluindo em um ponto inicial uma distribuição triangular), mas em grande parte desse trabalho era matemática (em vez que a intuição) que foi usada. Laplace examinou distribuições exponenciais e normais duplas (entre várias outras), por exemplo. Da mesma forma, Gauss usou a matemática para derivá-la na mesma época, mas em relação a um conjunto diferente de considerações que Laplace.
No sentido estrito em que Laplace e Gauss estavam considerando "distribuições de erros", poderíamos considerar uma "busca por uma distribuição", pelo menos por um tempo. Ambos postularam algumas propriedades para uma distribuição de erros que consideravam importantes (Laplace considerou uma sequência de critérios um pouco diferentes ao longo do tempo) levou a diferentes distribuições.
Basicamente, minha pergunta é por que a função de densidade de probabilidade de distribuição normal tem um formato de sino e não qualquer outro?
A forma funcional da coisa que é chamada função de densidade normal confere essa forma. Considere o normal padrão (por simplicidade; todos os outros normais têm a mesma forma, diferindo apenas em escala e localização):
fZ( z) = k ⋅ e- 12z2;- ∞ < z< ∞
(onde é simplesmente uma constante escolhida para formar a área total 1)k
isso define o valor da densidade em todos os valores de ; portanto, descreve completamente o formato da densidade. A esse objeto matemático é a que ligamos o rótulo "distribuição normal". Não há nada de especial no nome; é apenas um rótulo que atribuímos à distribuição. Ele tem muitos nomes (e ainda é chamado de coisas diferentes por pessoas diferentes).x
Enquanto algumas pessoas consideram a distribuição normal como algo "usual", na verdade, é apenas em conjuntos particulares de situações que você até a vê como uma aproximação.
A descoberta da distribuição é geralmente creditada a de Moivre (como uma aproximação ao binômio). Com efeito, ele derivou a forma funcional ao tentar aproximar os coeficientes binomiais (/ probabilidades binomiais) para aproximar cálculos tediosos, mas - enquanto ele efetivamente deriva a forma da distribuição normal - ele não parece ter pensado em sua aproximação como uma distribuição de probabilidade, embora alguns autores sugiram que sim. É necessária uma certa quantidade de interpretação, para que haja margem para diferenças nessa interpretação.
Gauss e Laplace trabalharam nisso no início de 1800; Gauss escreveu sobre isso em 1809 (em conexão com a distribuição para a qual a média é o MLE do centro) e Laplace em 1810, como uma aproximação à distribuição de somas de variáveis aleatórias simétricas. Uma década depois, Laplace fornece uma forma inicial de teorema do limite central, para variáveis discretas e contínuas.
Os nomes antigos para a distribuição incluem a lei do erro , a lei da frequência dos erros , e também foi nomeado após Laplace e Gauss, às vezes em conjunto.
O termo "normal" foi usado para descrever a distribuição de forma independente por três autores diferentes na década de 1870 (Peirce, Lexis e Galton), o primeiro em 1873 e os outros dois em 1877. Isso ocorre mais de sessenta anos após o trabalho de Gauss e Laplace e mais que o dobro desde a aproximação de de Moivre. O uso de Galton provavelmente foi o mais influente, mas ele usou o termo "normal" em relação a ele apenas uma vez no trabalho de 1877 (principalmente o chamado "lei do desvio").
No entanto, na década de 1880, Galton usou o adjetivo "normal" em relação à distribuição várias vezes (por exemplo, como a "curva normal" em 1889) e, por sua vez, teve muita influência em estatísticos posteriores no Reino Unido (especialmente Karl Pearson ) Ele não disse por que usou o termo "normal" dessa maneira, mas presumivelmente o quis dizer no sentido de "típico" ou "usual".
O primeiro uso explícito da frase "distribuição normal" parece ser de Karl Pearson; ele certamente o usa em 1894, embora afirme ter usado muito antes (uma afirmação que eu consideraria com alguma cautela).
Referências:
Miller, Jeff
"Usos mais conhecidos de algumas das palavras da matemática:"
Distribuição normal (verbete de John Aldrich)
http://jeff560.tripod.com/n.html
Stahl, Saul (2006),
"A evolução da distribuição normal",
Mathematics Magazine , vol. 79, Nº 2 (abril), pp 96-113
https://www.maa.org/sites/default/files/pdf/upload_library/22/Allendoerfer/stahl96.pdf
Distribuição normal, (1 de agosto de 2016).
Na Wikipedia, A Enciclopédia Livre.
Recuperado em 12:02, 3 de agosto de 2016, em
https://en.wikipedia.org/w/index.php?title=Normal_distribution&oldid=732559095#History
Hald, A (2007),
"Aproximação normal de De Moivre ao binômio, 1733, e sua generalização",
In: A History of Parametric Statistical Inference from Bernoulli to Fisher, 1713-1935; pp 17-24
[Você pode observar discrepâncias substanciais entre essas fontes em relação à conta de Moivre]