A razão mais óbvia é que geralmente não há sequência de tempo nos valores. Portanto, se você misturar os dados, não faz diferença nas informações transmitidas pelos dados. Se seguirmos o seu método, toda vez que você misturar os dados, obtém uma variação de amostra diferente.
A resposta mais teórica é que a variação da amostra estima a variação real de uma variável aleatória. A verdadeira variação de uma variável aleatória é
X
E[(X−EX)2].
Aqui representa expectativa ou "valor médio". Portanto, a definição da variância é a distância quadrática média entre a variável e seu valor médio. Quando você olha para essa definição, não há "ordem do tempo" aqui, pois não há dados. É apenas um atributo da variável aleatória.E
Ao coletar dados iid dessa distribuição, você realizações . A melhor maneira de estimar a expectativa é tomar as médias da amostra. A chave aqui é que obtivemos dados iid e, portanto, não há pedidos para os dados. A amostra é igual à amostrax 1 , x 2 , … , x n x 2 , x 5 , x 1 , x n . .x1,x2,…,xnx1,x2,…,xnx2,x5,x1,xn..
EDITAR
A variação da amostra mede um tipo específico de dispersão para a amostra, aquele que mede a distância média da média. Existem outros tipos de dispersão, como intervalo de dados e intervalo inter-quantil.
Mesmo se você classificar seus valores em ordem crescente, isso não altera as características da amostra. A amostra (dados) que você obtém são realizações de uma variável. Calcular a variação da amostra é semelhante ao entendimento de quanto dispersão há na variável. Por exemplo, se você provar 20 pessoas e calcular sua altura, essas são 20 "realizações" da variável aleatória altura das pessoas. Agora, a variação da amostra deve medir a variabilidade na altura dos indivíduos em geral. Se você solicitar os dados
100 , 110 , 123 , 124 , … ,X=
100,110,123,124,…,
isso não altera as informações na amostra.
Vamos ver mais um exemplo. permite dizer que tem 100 observações de uma variável aleatória ordenada desta forma Então a distância média subsequente é de 1 unidade; portanto, pelo seu método, a variação será 1.
1,2,3,4,5,6,7,8,9,10,11,12,13,14,...100.
A maneira de interpretar "variação" ou "dispersão" é entender qual faixa de valores é provável para os dados. Nesse caso, você obterá um intervalo de 0,99 unidades, o que obviamente não representa bem a variação.
Se, em vez de calcular a média, você somar as diferenças subseqüentes, sua variação será 99. É claro que isso não representa a variabilidade da amostra, porque 99 fornece o intervalo dos dados, não um senso de variabilidade.