Como avalio o desvio padrão?


15

Reuni respostas de 85 pessoas sobre sua capacidade de realizar determinadas tarefas.

As respostas estão em uma escala Likert de cinco pontos:

5 = Muito bom, 4 = Bom, 3 = Médio, 2 = Ruim, 1 = Muito ruim,

A pontuação média é de 2,8 e o desvio padrão é de 0,54.

Entendo o significado da média e do desvio padrão.

Minha pergunta é: quão bom (ou ruim) é esse desvio padrão?

Em outras palavras, existem diretrizes que possam auxiliar na avaliação do desvio padrão.


O que significaria para o SD ser bom ou ruim aqui?
gung - Restabelece Monica

7
É bastante difícil obter um SD tão pequeno com dados como este: para uma média de 2,8, o SD deve ser pelo menos . (Mesmo que 2,8 represente um valor arredondado, o DP ainda deve exceder 0,357.) Um DP de 0,54 implica que não mais que duas pessoas poderiam ter respondido com um 5 (com 21 2 e 62 3) e não mais que seis poderiam ter respondido. com um 1 (com 5 2 e 74 3). Isso sugere que a pergunta pode fornecer excepcionalmente pouca informação porque a escala não discrimina efetivamente. 0.2×0.8=0,4
whuber

@whuber excelentes dados forsensics! Mas eu também podia imaginar que ele calculou a média de perguntas diferentes ou fez algo errado em seus cálculos. Parece difícil imaginar que as pessoas realmente reagiram de maneira tão uniforme, principalmente quando falam sobre suas supostas habilidades.
Erik

Respostas:


17

Os desvios padrão não são "bons" ou "ruins". Eles são indicadores de como seus dados estão espalhados. Às vezes, nas escalas de classificação, queremos um amplo spread, pois indica que nossas perguntas / classificações cobrem a faixa do grupo que estamos avaliando. Outras vezes, queremos um sd pequeno, porque queremos que todos fiquem "chapados".

3+2

Então. Qual é o objetivo do seu teste? Quem está na amostra?


2
(+1) Apenas para adicionar um pouco à observação "Os desvios padrão não são 'bons' ou 'ruins'" - ter um preditor com grande desvio padrão pode ser "bom" porque, em regressão, está inversamente relacionado ao padrão erro de uma estimativa do coeficiente de regressão. Por outro lado, se você se preocupa com a precisão de uma medição, um grande desvio padrão é "ruim". Acho que o interesse do pôster original está mais próximo do primeiro, mas não está claro.
Macro

10

Resposta curta, tudo bem e um pouco menor do que eu poderia esperar dos dados da pesquisa. Mas provavelmente sua história de negócios está mais na média ou no percentual máximo de 2 caixas.

Para escalas discretas da pesquisa em ciências sociais, na prática o desvio padrão é uma função direta da média. Em particular, descobri, através da análise empírica de muitos desses estudos, que o desvio padrão real em pesquisas em escalas de 5 pontos é de 40% a 60% da variação máxima possível (infelizmente não documentado aqui).

No nível mais simples, considere os extremos, imagine que a média foi 5,0. O desvio padrão deve ser zero, pois a única maneira de obter a média de 5 é que todos respondam 5. Por outro lado, se a média for 1,0, o erro padrão também deve ser 0. Portanto, o desvio padrão é definido com precisão, dada a média.

Agora, entre mais área cinzenta. Imagine que as pessoas pudessem responder 5,0 ou 1,0, mas nada no meio. Então o desvio padrão é uma função precisa da média:

stdev = sqrt ((média 5) * (média 1))

O desvio padrão máximo para respostas em qualquer escala limitada é metade da largura da escala. Aqui está sqrt ((5-3) (3-1)) = sqrt (2 * 2) = 2.

Agora é claro que as pessoas podem responder valores no meio. Dos metastudies dos dados da pesquisa em nossa empresa, constato que o desvio padrão para escalas numéricas na prática é de 40% a 60% do máximo. Especificamente

  • 40% para escalas de pontos de 100%,
  • 50% para escalas de 10 pontos e
  • 60% para escalas de 5 pontos e
  • 100% para escalas binárias

Portanto, para o seu conjunto de dados, eu esperaria um desvio padrão de 60% x 2,0 = 1,2. Você obteve 0,54, o que é cerca da metade do que eu esperaria se os resultados fossem classificações auto-explicativas. Os resultados das classificações de habilidades de baterias de testes mais complicadas são médias e, portanto, teriam uma variação menor?

A história real, no entanto, é provavelmente a capacidade é tão baixa ou tão alta em relação a outras tarefas. Relate as médias ou porcentagens de caixa máxima entre as habilidades e concentre sua análise nisso.


-1

Se os dados forem normalmente distribuídos, você poderá ver como a população está localizada.

  • 68% de todas as pessoas estão dentro de um desvio padrão da média ( 2.26 - 3.34):

insira a descrição da imagem aqui

  • 95% de todas as pessoas estão dentro de 2 desvios padrão da média ( 1.72 - 3.88):

insira a descrição da imagem aqui

Ele diz como os números estão "espalhados".


11
Esta resposta não foi votada porque está incorreta: ela usa uma regra geral aproximada (como se fosse exata) em um caso em que não é aplicável. A resposta seria verdadeira se substituída pelas conclusões da Desigualdade de Chebyshev (que afirma que pelo menos 75% das observações estão dentro de dois DPs da observação média; ou seja, pelo menos 75% das respostas são 2 ou 3), mas isso não fornecerá muita percepção.
whuber

Além disso, isso só é verdade para populações verdadeiramente normalmente distribuídas. A partir daí, você pode calcular os números arbitrariamente exatamente avaliando a integral sobre o pdf normal dentro dos limites dados pelo sd em torno da média. Realmente não é útil aqui.
Douba 17/03
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.