Desculpe, se isso foi respondido em outro lugar, não consegui encontrá-lo.
Gostaria de saber por que usamos a raiz quadrada , em particular, da variação para criar o desvio padrão? O que é pegar a raiz quadrada que produz um valor útil?
Desculpe, se isso foi respondido em outro lugar, não consegui encontrá-lo.
Gostaria de saber por que usamos a raiz quadrada , em particular, da variação para criar o desvio padrão? O que é pegar a raiz quadrada que produz um valor útil?
Respostas:
Em certo sentido, essa é uma pergunta trivial, mas, em outro, é realmente bastante profunda!
Como já foi mencionado, tomando a raiz quadrada implica tem as mesmas unidades que .
Tomar a raiz quadrada fornece uma homogeneidade absoluta, também conhecida como escalabilidade absoluta . Para qualquer escalar e variável aleatória , temos:
Numa espaço vectorial dimensional, a norma euclidiana padrão conhecido como o norma está definido como:
Mais amplamente, o -norm leva o th raiz para obter absoluta homogeneidade: .
Se você tiver pesos , a soma ponderada também é uma norma válida. Além disso, é o desvio padrão se representar probabilidades e
Em um espaço Hilbert de dimensão infinita, da mesma forma, podemos definir a norma :
Se é uma variável aleatória média zero e é a medida de probabilidade, qual é o desvio padrão? É o mesmo: .
Tomando a raiz quadrada faz significa que o desvio padrão satisfaz a homogeneidade absoluta , uma propriedade necessária de uma norma .
Em um espaço de variáveis aleatórias, é um produto interno e o norma induzida por esse produto interno . Portanto, o desvio padrão é a norma de uma variável aleatória :
É uma medida da distância da média a .‖ X ‖ 2 = √ Stdev[X]="X-E[X]"2E[X]X
(Ponto técnico: enquanto é uma norma, o desvio padrão não é uma norma sobre variáveis aleatórias em geral, porque um requisito para um espaço vetorial normalizado é se e somente se . Um desvio padrão de 0 não ' t implica que a variável aleatória é o elemento zero.) "x"=0x=0
A variação de é definida como , portanto, é uma expectativa de uma diferença ao quadrado entre X e seu valor esperado.V ( X ) = E ( X - E ( X ) ) 2
Se é o tempo em segundos, está em segundos, mas está em e está novamente em segundos.X - E ( X ) V ( X ) segundos 2 √
Em termos mais simples, o desvio padrão é projetado para nos fornecer um número positivo que diz algo sobre a disseminação de nossos dados sobre sua média.
Se somarmos as distâncias de todos os pontos da média, os pontos nas direções positiva e negativa se combinariam de uma maneira que tenderia a gravitar de volta para a média e perderíamos informações sobre a propagação. É por isso que medimos a variação primeiro, para que todas as distâncias sejam preservadas como quantidades positivas via quadratura e elas não se cancelem. No final, queremos um valor positivo que represente as unidades com as quais começamos - isso já foi comentado acima -, então tomamos a raiz quadrada positiva.
É uma estupidez histórica que continuamos devido à preguiça intelectual. Eles escolheram quadrado as diferenças da média para se livrar do sinal de menos. Então eles pegaram a raiz quadrada para trazê-la para uma escala semelhante à média.
Alguém deve gerar novas estatísticas, variação de computação e DP usando módulo ou valores absolutos de desvio da média. Isso eliminaria toda essa quadratura e, em seguida, acabaria com o negócio da raiz quadrada.