Para um dado conjunto de dados, o spread é frequentemente calculado como o desvio padrão ou como o IQR (intervalo inter-quartil).
Enquanto a standard deviation
é normalizado (escores z, etc.) e, portanto, pode ser usado para comparar a dispersão de duas populações diferentes, esse não é o caso do IQR, pois as amostras de duas populações diferentes podem ter valores em duas escalas bem diferentes,
e.g.
Pop A: 100, 67, 89, 75, 120, ...
Pop B: 19, 22, 43, 8, 12, ...
O que eu busco é uma medida robusta (não paramétrica) que eu possa usar para comparar a variação dentro de diferentes populações.
Escolha 1:
IQR / Median
- isso seria por analogia com o coeficiente de variação , ou seja, para .
Escolha 2:
Range / IQR
Pergunta: Qual é a medida mais significativa para comparar a variação entre populações? E se for a Opção 1, a Opção 2 é útil para algo / significativo, ou é uma medida fundamentalmente defeituosa?