Primeiro, eu não sou estatístico. No entanto, tenho feito análise estatística de redes para meu doutorado.
Como parte da análise de rede, plotei uma Função de Distribuição Cumulativa Complementar (CCDF) de graus de rede. O que descobri foi que, diferentemente das distribuições de rede convencionais (por exemplo, WWW), a distribuição é melhor ajustada por uma distribuição lognormal. Tentei ajustá-lo a uma lei de energia e, usando os scripts Matlab de Clauset et al., Descobri que a cauda da curva segue uma lei de energia com um limite.
A linha pontilhada representa o ajuste da lei de energia. A linha roxa representa o ajuste log-normal. A linha verde representa ajuste exponencial.
O que estou lutando para entender é o que tudo isso significa? Eu li este artigo de Newman, que aborda um pouco esse tópico: http://arxiv.org/abs/cond-mat/0412004
Abaixo está o meu palpite:
Se a distribuição de graus segue uma distribuição de lei de energia, entendo que isso significa que existe um vínculo preferencial linear na distribuição de links e grau de rede (rich obtém um efeito mais rico ou o processo de Yules).
Estou certo ao dizer que, com a distribuição lognormal que estou testemunhando, existe uma ligação preferencial sublinear no início da curva e se torna mais linear em relação à cauda, onde pode ser ajustada por uma lei de potência?
Além disso, como uma distribuição log-normal ocorre quando o logaritmo da variável aleatória (digamos X) é normalmente distribuído, isso significa que, em uma distribuição log-normal, há mais valores pequenos de X e valores menores de X que um variável aleatória que segue uma distribuição de lei de potência teria?
Mais importante, com relação à distribuição de graus de rede, um anexo preferencial normal de log ainda sugere uma rede sem escala? Meu instinto me diz que, como a cauda da curva pode ser ajustada por uma lei de energia, a rede ainda pode ser concluída como exibindo características sem escala.