Deixe-me começar negando a premissa. Robert Geary provavelmente não exagerou o caso quando disse (em 1947) " ... normalidade é um mito; nunca houve e nunca haverá uma distribuição normal. " -
a distribuição normal é um modelo *, um aproximação que às vezes é mais ou menos útil.
* (sobre o qual, veja George Box , embora eu prefira a versão no meu perfil).
O fato de alguns fenômenos serem aproximadamente normais pode não ser uma grande surpresa, uma vez que somas de efeitos independentes [ou mesmo efeitos não muito correlacionados] deveriam, se houver muitos deles e nenhum tiver uma variação substancial em comparação com a variação do A soma do resto que podemos ver a distribuição tende a parecer mais normal.
O teorema do limite central (que é sobre a convergência para uma distribuição normal de uma amostra padronizada média conforme vai para o infinito sob algumas condições amenas) pelo menos sugere que podemos ver uma tendência para essa normalidade com tamanhos de amostra suficientemente grandes, mas finitos.n
Obviamente, se os meios padronizados forem aproximadamente normais, somas padronizadas serão; esse é o motivo do raciocínio "soma de muitos efeitos". Portanto, se houver muitas pequenas contribuições para a variação e elas não estiverem altamente correlacionadas, você poderá vê-la.
O teorema de Berry-Esseen nos dá uma afirmação sobre ele (convergência para distribuições normais) que realmente acontece com médias de amostra padronizadas para dados iid (sob condições um pouco mais rigorosas do que para o CLT, pois exige que o terceiro momento absoluto seja finito), como além de nos contar sobre a rapidez com que isso acontece. Versões subseqüentes do teorema lidam com componentes distribuídos de maneira não idêntica na soma , embora os limites superiores do desvio da normalidade sejam menos restritos.
Menos formalmente, o comportamento de convoluções com distribuições razoavelmente boas nos dá motivos adicionais (embora intimamente relacionados) para suspeitar que possa tender a ser uma aproximação justa em amostras finitas em muitos casos. A convolução atua como uma espécie de operador de "difusão" com o qual as pessoas que usam a estimativa de densidade de kernel em vários kernels estarão familiarizadas; depois de padronizar o resultado (para que a variação permaneça constante cada vez que você faz uma operação assim), há uma progressão clara em direção a formas cada vez mais simétricas de colinas à medida que você suaviza repetidamente (e não importa muito se você mudar o kernel toda vez).
Terry Tao faz uma boa discussão sobre versões do teorema do limite central e do teorema de Berry-Esseen aqui , e ao longo do caminho menciona uma abordagem para uma versão não independente do Berry-Esseen.
Portanto, há pelo menos uma classe de situações em que podemos esperar vê-lo, e razões formais para pensar que realmente tenderão a acontecer nessas situações. No entanto, na melhor das hipóteses, qualquer sentido de que o resultado de "somas de muitos efeitos" seja normal é uma aproximação. Em muitos casos, é uma aproximação bastante razoável (e, em casos adicionais, embora a aproximação da distribuição não seja próxima, alguns procedimentos que assumem a normalidade não são especialmente sensíveis à distribuição dos valores individuais, pelo menos em amostras grandes).
Existem muitas outras circunstâncias em que os efeitos não "adicionam" e podemos esperar que outras coisas aconteçam; por exemplo, em muitos dados financeiros, os efeitos tendem a ser multiplicativos (os efeitos movimentam valores em termos percentuais, como juros, inflação e taxas de câmbio, por exemplo). Lá, não esperamos normalidade, mas às vezes podemos observar uma aproximação aproximada da normalidade na escala logarítmica. Em outras situações, nenhum dos dois pode ser apropriado, mesmo em um sentido aproximado. Por exemplo, os tempos entre eventos geralmente não serão bem aproximados pela normalidade ou normalidade dos logs; não há "somas" nem "produtos" de efeitos a serem discutidos aqui. Existem inúmeros outros fenômenos nos quais podemos argumentar sobre um tipo particular de "lei" em circunstâncias particulares.