Você tem uma versão discreta da distribuição de log negativa, ou seja, a distribuição cujo suporte é e cujo pdf é f ( t ) = - log t .[0,1]f(t)=−logt
Para ver isso, vou redefinir sua variável aleatória para obter valores no conjunto vez de { 0 , 1 , 2 , … , N } e chamar o resultante distribuição t . Então, minha reivindicação é que{0,1/N,2/N,…,1}{0,1,2,…,N}T
Pr(T=tN)→−1Nlog(tN)
como enquanto tN,t→∞tN é mantido (aproximadamente) constante.
Primeiro, um pequeno experimento de simulação demonstrando essa convergência. Aqui está uma pequena implementação de um amostrador da sua distribuição:
t_sample <- function(N, size) {
bounds <- sample(1:N, size=size, replace=TRUE)
samples <- sapply(bounds, function(t) {sample(1:t, size=1)})
samples / N
}
Aqui está um histograma de uma grande amostra retirada de sua distribuição:
ss <- t_sample(100, 200000)
hist(ss, freq=FALSE, breaks=50)
e aqui está o pdf logarítmico sobreposto:
linsp <- 1:100 / 100
lines(linsp, -log(linsp))
Para ver por que essa convergência ocorre, comece com sua expressão
Pr(T=tN)=1N∑j=tN1j
e multiplique e divida por N
Pr(T=tN)=1N∑j=tNNj1N
A soma agora é uma soma de Riemann para a função , integrado a partir detg(x)=1xtN1N ,
Pr(T=tN)≈1N∫1tN1xdx=−1Nlog(tN)
qual é a expressão que eu queria chegar.