Minha intuição é que o desvio padrão é: uma medida de propagação dos dados.
Você tem um bom argumento de que se é amplo ou restrito depende de qual é nossa suposição subjacente para a distribuição dos dados.
Advertência: Uma medida de dispersão é mais útil quando a distribuição de seus dados é simétrica em torno da média e apresenta uma variação relativamente próxima à da distribuição Normal. (Isso significa que é aproximadamente normal.)
No caso em que os dados são aproximadamente normais, o desvio padrão possui uma interpretação canônica:
- Região: média da amostra +/- 1 desvio padrão, contém aproximadamente 68% dos dados
- Região: média da amostra +/- 2 desvio padrão, contém aproximadamente 95% dos dados
- Região: média da amostra +/- 3 desvio padrão, contém aproximadamente 99% dos dados
(veja o primeiro gráfico no Wiki )
Isso significa que, se soubermos que a média da população é 5 e o desvio padrão é 2,83 e assumirmos que a distribuição é aproximadamente Normal, eu diria a você que estou razoavelmente certo de que, se fizermos (muitas) muitas observações, apenas 5% serão ser menor que 0,4 = 5 - 2 * 2,3 ou maior que 9,6 = 5 + 2 * 2,3.
Observe qual é o impacto do desvio padrão em nosso intervalo de confiança? (quanto mais propagação, mais incerteza)
Além disso, no caso geral em que os dados não são aproximadamente normais, mas simétricos, você sabe que existem alguns para os quais:α
- Região: média da amostra +/- desvio padrão, contém aproximadamente 95% dos dadosα
Você pode aprender o de uma subamostra ou assumir α = 2, o que geralmente fornece uma boa regra geral para o cálculo mental de quais observações futuras serão esperadas ou quais das novas observações podem ser consideradas outliers. (tenha em mente a ressalva!)αα=2
Não vejo como você deve interpretá-lo. 2.83 significa que os valores estão muito amplos ou estão todos agrupados em torno da média ...
Eu acho que todas as perguntas que sejam "amplas ou restritas" também devem conter: "em relação a quê?". Uma sugestão pode ser usar uma distribuição conhecida como referência. Dependendo do contexto, pode ser útil pensar: "É muito mais amplo ou mais apertado que um Normal / Poisson?".
EDIT: Com base em uma dica útil nos comentários, mais um aspecto sobre o desvio padrão como medida de distância.
Ainda outra intuição da utilidade do desvio padrão é que é uma medida de distância entre os dados da amostra x 1 , … , x N e sua média ˉ x :sNx1,…,xNx¯
sN=1N∑Ni=1(xi−x¯¯¯)2−−−−−−−−−−−−−√
Como comparação, o erro quadrado médio (MSE), uma das medidas de erro mais populares nas estatísticas, é definido como:
MSE=1n∑ni=1(Yi^−Yi)2
As questões podem ser levantadas por que a distância acima funciona? Por que distâncias quadradas, e não distâncias absolutas, por exemplo? E por que estamos pegando a raiz quadrada?
Ter funções quadráticas de distância ou erro tem a vantagem de podermos diferenciá-las e minimizá-las facilmente. No que diz respeito à raiz quadrada, ela contribui para a interpretabilidade, pois converte o erro de volta à escala de nossos dados observados.