Digamos que eu estou calculando alturas (em cm) e os números devem ser maiores que zero.
Aqui está a lista de exemplo:
0.77132064
0.02075195
0.63364823
0.74880388
0.49850701
0.22479665
0.19806286
0.76053071
0.16911084
0.08833981
Mean: 0.41138725956196015
Std: 0.2860541519582141
Neste exemplo, de acordo com a distribuição normal, 99,7% dos valores devem estar entre ± 3 vezes o desvio padrão da média. No entanto, mesmo duas vezes o desvio padrão se torna negativo:
-2 x std calculation = 0.41138725956196015 - 0.2860541519582141 x 2 = -0,160721044354468
No entanto, meus números devem ser positivos. Portanto, eles devem estar acima de 0. Posso ignorar números negativos, mas duvido que esta seja a maneira correta de calcular probabilidades usando o desvio padrão.
Alguém pode me ajudar a entender se estou usando isso da maneira correta? Ou preciso escolher um método diferente?
Bem, para ser honesto, matemática é matemática. Não importa se é uma distribuição normal ou não. Se funcionar com números não assinados, também deverá funcionar com números positivos! Estou errado?
EDIT1: histograma adicionado
Para ser mais claro, adicionei o histograma dos meus dados reais
EDIT2: Alguns valores
Mean: 0.007041500928135767
Percentile 50: 0.0052000000000000934
Percentile 90: 0.015500000000000047
Std: 0.0063790857035425025
Var: 4.06873389299246e-05