Por que a raiz quadrada é obtida para a contagem de amostras "N" na fórmula de desvio padrão?


9

Estou tentando entender um conceito muito básico de desvio padrão.

Da fórmula σ=i=1n(xiμ)2N

Não consigo entender por que devemos reduzir pela metade a população "N", ou seja, por que queremos tomar N quando não fizemosN2 ? Isso não distorce a população que estamos considerando?

Não deve ser a fórmula ser σ=i=1n(xiμ)2N

Respostas:


10

Você está tentando encontrar um desvio "típico" da média.

A variação é "a distância ao quadrado média da média".

O desvio padrão é a raiz quadrada disso.

Isso o torna o desvio da raiz quadrada da média.

  1. Por que usaríamos o desvio quadrado médio? O que torna a variação interessante? Entre outras coisas, devido a um fato básico sobre as variações - que a variação de uma soma de variáveis ​​não correlacionadas é a soma das variações individuais. (Isso é abordado em várias perguntas, por exemplo, aqui no CrossValidated. Esse recurso útil não é compartilhado, por exemplo, pelo desvio médio absoluto.
  2. Por que raiz quadrada disso? Porque então está nas mesmas unidades que as observações originais. Ele mede um tipo específico de 'distância típica' da média (como mencionado, a distância RMS) - mas por causa da propriedade de variação acima - uma que possui alguns recursos interessantes.

7

O desvio padrão é a raiz quadrada da variação .

A variação é a distância quadrática média dos dados da média. Como uma média é a soma dividida pelo número de itens somados, a fórmula da variação é:
Como, novamente, o desvio padrão é simplesmente a raiz quadrada disso, a fórmula para o desvio padrão é:SD(X)=

Var(X)=E[(Xμ)2]=i=1N(xiμ)2N

Nada foi adicionado ou alterado sobre os pressupostos ou a variância aqui, nós simplesmente tomou a raiz quadrada da variância, porque é isso que o desvio padrãoé.
S.D.(X)=Var(X)=i=1N(xiμ)2N

talvez deva ser mencionado que essa fórmula de variação é verdadeira apenas para uniformes discretos. caso contrário, pode confundir a distinção entre a amostra e variância da população
Taylor

@ Taylor, eu não sei o que você quer dizer. A fórmula para a variação não está relacionada à distribuição.
gung - Restabelece Monica

a fórmula para a variação (de amostra) não está relacionada à distribuição ( pt.wikipedia.org/wiki/Expected_value#Definition )
Taylor

Var(X)=E[(Xμ)2]

μ=EXE[(Xμ)2]X1Ni(xiμ)2Xμ

1

A primeira coisa a entender é que o desvio padrão (std) é diferente do desvio absoluto médio . Esses dois definem propriedades matemáticas diferentes sobre os dados.

Diferentemente do desvio absoluto médio, o desvio padrão (std) pesa mais nos valores que estão longe da média, o que é feito ao quadrado dos valores das diferenças.

Data(x)|xmean|(xmean)222422466366636x=0(|xmean|)=16(xmean)2=80

=16/4=4.0

80/4=20=4.47

Nos dados, existem dois pontos a 6 distância da média e dois pontos a 2 distância da média. Portanto, o desvio de 4,47 faz mais sentido do que 4.

NNN


0

a/b=()da2b=ccb=d

522.5

522=12.512.52=2.5

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.