O coeficiente de Gini é invariável em escala e é limitado, o desvio padrão invariável a uma mudança e ilimitado, portanto é difícil comparar diretamente. Agora você pode definir uma versão invariável da escala do desvio padrão, dividindo pela média (coeficiente de variação).
No entanto, o índice de Gini ainda é baseado em valores, o segundo em valores ao quadrado, portanto, você pode esperar que o segundo seja mais influenciado por valores discrepantes (valores excessivamente baixos ou altos). Isso pode ser encontrado nas medidas de desigualdade de renda , F De Maio, 2007:
Essa medida da desigualdade de renda é calculada dividindo o desvio padrão da distribuição de renda por sua média. Distribuições de renda mais iguais terão desvios-padrão menores; como tal, o currículo será menor em sociedades mais iguais. Apesar de ser uma das medidas mais simples de desigualdade, o uso do CV tem sido bastante limitado na literatura de saúde pública e não foi destaque em pesquisas sobre a hipótese de desigualdade de renda. Isso pode ser atribuído a importantes limitações da medida CV: (1) não possui um limite superior, diferentemente do coeficiente de Gini, 18 dificultando a interpretação e a comparação; e (2) os dois componentes do CV (a média e o desvio padrão) podem ser extremamente influenciados por valores de renda anomalamente baixos ou altos. Em outras palavras,
Portanto, o coeficiente de variação é menos robusto e ainda ilimitado. Para dar um passo adiante, você pode remover a média e dividir pelo desvio absoluto ( ). Até um fator, você acaba com uma relação de norma , que pode ser limitada, pois, para um vetor de ponto , .ℓ 1 / ℓ 2 N ℓ 2 ( x ) ≤ ℓ 1 ( x ) ≤ √ℓ1(x−m)=∑|xn−m|ℓ1/ℓ2Nℓ2(x)≤ℓ1(x)≤N−−√ℓ2(x)
Agora você tem, com o índice de Gini e a proporção da norma , duas medidas interessantes de dispersão da distribuição, invariável e limitado pela escala.ℓ1/ℓ2
Eles são comparados em Comparing Measures of Sparsity , 2009. Testado contra diferentes propriedades naturais da escarsidade (Robin Hood, Escalada, Maré Ascendente, Clonagem, Bill Gates e Bebês), o índice Gini se destaca como o melhor. Mas sua forma dificulta o uso como uma função de perda, e versões regularizadas doℓ1/ℓ2 podem ser usadas nesse contexto.
Portanto, a menos que você queira caracterizar uma distribuição quase gaussiana, se desejar medir uma dispersão, use o índice Gini. Se você deseja promover a dispersão entre modelos diferentes, tente uma proporção dessa norma.
Palestra adicional: Diferença média de Gini: uma medida superior de variabilidade para distribuições não normais , Shlomo Yitzhaki, 2003, cujo resumo pode parecer interessante:
De todas as medidas de variabilidade, a variação é de longe a mais popular. Este artigo argumenta que a Diferença Média de Gini (GMD), um índice alternativo de variabilidade, compartilha muitas propriedades com a variação, mas pode ser mais informativo sobre as propriedades das distribuições que partem da normalidade