Bem, se você tem uma amostra X1, . . . , Xn de uma distribuição de pareto com os parâmetros m > 0 e α > 0 (onde m é o parâmetro do limite inferior e α é o parâmetro de forma), a probabilidade logarítmica dessa amostra é:
n log( α ) + n α log( m ) - ( α + 1 ) ∑i = 1nregistro( XEu)
este é um aumento monotônico em , portanto, o maximizador é o maior valor que é consistente com os dados observados. Como o parâmetro m define o limite inferior do suporte para a distribuição de Pareto, o ideal émm
m^= minEuXEu
o que não depende de . Em seguida, usando truques comuns de cálculo, o MLE para deve satisfazerααα
nα+ n log( m^) - ∑i = 1nregistro( XEu) = 0
alguma álgebra simples nos diz que o MLE de éα
α^= n∑ni = 1registro( XEu/ m^)
Em muitos sentidos importantes (por exemplo, eficiência assintótica ideal, pois atinge o limite inferior de Cramer-Rao), esta é a melhor maneira de ajustar dados a uma distribuição de Pareto. O código R abaixo calcula o MLE para um determinado conjunto de dados X
,.
pareto.MLE <- function(X)
{
n <- length(X)
m <- min(X)
a <- n/sum(log(X)-log(m))
return( c(m,a) )
}
# example.
library(VGAM)
set.seed(1)
z = rpareto(1000, 1, 5)
pareto.MLE(z)
[1] 1.000014 5.065213
Edit: Com base nos comentários de @cardinal e I abaixo, também podemos observar que é o inverso da média da amostra do 's, que acontece com tem uma distribuição exponencial. Portanto, se tivermos acesso a software que possa se ajustar a uma distribuição exponencial (o que é mais provável, pois parece surgir em muitos problemas estatísticos), o ajuste de uma distribuição de Pareto poderá ser realizado transformando os dados dessa maneira e ajustando-os a uma distribuição exponencial na escala transformada. log(Xi/ m )α^registro( XEu/ m^)