Uma generalização da questão pede a distribuição de quando a distribuição de X é conhecida e suportada nos números naturais. (Na questão, X tem uma distribuição de Poisson do parâmetro λ = λ 1 + λ 2 + ⋯ + λ n e m = n .)Y= ⌊ X/ m⌋XXλ = λ1+ λ2+ ⋯ + λnm = n
A distribuição de é facilmente determinada pela distribuição de m Y , cuja probabilidade de geração de função (PGF) pode ser determinada em termos da PGF de X . Aqui está um resumo da derivação.Ym YX
Escreva para o pgf de X , onde (por definição) p n = Pr ( X = n ) . é construído a partir de forma que seu pgf, , sejap ( x ) = p0 0+ p1x + ⋯ + pnxn+ ⋯Xpn= Pr ( X= n )X qm YXq
q( X )=( p0 0+ p1+ ⋯ + pm - 1) + ( pm+ pm + 1+ ⋯ + p2 m - 1) xm+ ⋯ +( pn m+ pn m + 1+ ⋯ + p( n + 1 ) m - 1) xn m+ ⋯ .
Porque isso converge absolutamente para , podemos reorganizar os termos em uma soma de partes do formulário| x | ≤ 1
Dm , tp ( x ) = pt+ pt + mxm+ ⋯ + pt + n mxn m+ ⋯
para . A série de potências das funções consiste em todos os termos da série de começando com : isso às vezes é chamado de dizimação de . Atualmente, as pesquisas do Google não apresentam muitas informações úteis sobre dizimações. Portanto, para ser completo, aqui está uma derivação de uma fórmula.x t D m , t p m th p t th pt=0,1,…,m−1xtDm,tpmthptthp
Vamos ser qualquer primitiva raiz da unidade; por exemplo, considere . Segue-se de e quem th ω = exp ( 2 i π / m ) ω m = 1 ∑ m - 1 j = 0 ω j = 0ωmthω=exp(2iπ/m)ωm=1∑m−1j=0ωj=0
xtDm , tp ( x ) = 1m∑j = 0m - 1ωt jp ( x / ωj) .
Para ver isso, observe que o operador é linear, portanto basta verificar a fórmula com base . A aplicação do lado direito a fornece { 1 , x , x 2 , … , x n , … } x nxtDm , t{ 1 , x , x2, … , Xn, … }xn
xtDm , t[ xn] = 1m∑j = 0m - 1ωt jxnω- n j= xnm∑j =0m - 1ω( t - n ) j .
Quando e diferem por um múltiplo de , cada termo na soma é igual a e obtemos . Caso contrário, os termos alternam entre potências de e somam zero. Onde este operador preserva todas as potências de congruente com modulo e mata todos os outros: é precisamente a projecção desejada.n m 1 x n ω t - n x t mtnm1xnωt - nxtm
Uma fórmula para segue prontamente, alterando a ordem da soma e reconhecendo uma das somas como geométrica, escrevendo-a de forma fechada:q
q( X )= ∑t = 0m - 1( Dm , t[ p ] ) ( x )= ∑t = 0m - 1x- t1m∑j=0m−1ωtjp(ω−jx)=1m∑j=0m−1p(ω−jx)∑t=0m−1(ωj/x)t=x(1−x−m)m∑j=0m−1p(ω−jx)x−ωj.
Por exemplo, o pgf de uma distribuição Poisson do parâmetro é . Com , e o pgf de seráp ( x ) = exp ( λ ( x - 1 ) ) m = 2 ω = - 1 2 Yλp(x)=exp(λ(x−1))m=2ω=−12Y
q(x)=x(1−x−2)2∑j=02−1p((−1)−jx)x−(−1)j=x−1/x2(exp(λ(x−1))x−1+exp(λ(−x−1))x+1)=exp(−λ)(sinh(λx)x+cosh(λx)).
Um uso dessa abordagem é calcular momentos de e . O valor da derivada do pgf avaliado em é o momento fatorial . O momento é uma combinação linear dos primeiros momentos fatoriais. Usando essas observações, descobrimos, por exemplo, que para um Poisson distribuído , sua média (que é o primeiro momento fatorial) é igual a , a média de é igual a , e a média de é igual am Y k th x = 1 k th k th k X λ 2 ⌊ ( X / 2 ) ⌋ λ - 1XmYkthx=1kthkthkXλ2⌊(X/2)⌋3⌊(X/3)⌋λ-1+e-3λ/2(sin ( √λ−12+12e−2λ3⌊(X/3)⌋λ−1+e−3λ/2(sin(3√λ2)3√+cos(3√λ2)) :
As médias para são mostradas em azul, vermelho e amarelo, respectivamente, como funções de : assintoticamente, a média cai comparação com a média original de Poisson.λ ( m - 1 ) / 2m=1,2,3λ(m−1)/2
Fórmulas semelhantes para as variações podem ser obtidas. (Eles ficar confuso como sobe e assim são omitidos Uma coisa que definitivamente estabelecer é que quando. não múltiplo de é Poisson: ele não tem a igualdade característica da média e variância) Aqui é um gráfico das variações em função de para :m > 1 Y λ m = 1 , 2 , 3mm>1Yλm=1,2,3
É interessante que, para valores maiores de as variações aumentem . Intuitivamente, isso se deve a dois fenômenos concorrentes: a função de piso está efetivamente impedindo grupos de valores que originalmente eram distintos; isso deve fazer com que a variação diminua. Ao mesmo tempo, como vimos, os meios também estão mudando (porque cada compartimento é representado por seu menor valor); isso deve fazer com que um termo igual ao quadrado da diferença de médias seja adicionado novamente. O aumento da variância para grande torna-se maior com valores maiores de .λ mλλm
O comportamento da variância de com é surpreendentemente complexo. Vamos terminar com uma rápida simulação (in ) mostrando o que ele pode fazer. Os gráficos mostram a diferença entre a variância de e a variância de para Poisson distribuído com vários valores de variando de a . Em todos os casos, as parcelas parecem ter atingido seus valores assintóticos à direita.m m ⌊ X / m ⌋ X X λ 1 5000mYmR
m⌊X/m⌋XXλ15000
set.seed(17)
par(mfrow=c(3,4))
temp <- sapply(c(1,2,5,10,20,50,100,200,500,1000,2000,5000), function(lambda) {
x <- rpois(20000, lambda)
v <- sapply(1:floor(lambda + 4*sqrt(lambda)),
function(m) var(floor(x/m)*m) - var(x))
plot(v, type="l", xlab="", ylab="Increased variance",
main=toString(lambda), cex.main=.85, col="Blue", lwd=2)
})