Seja a distribuição suportada nos números que atribui probabilidades a cada Por definição, seu momento (bruto) do grau éFx1<x2<…<xnpi>0xi.k
μk=∑i=1npixki.
Começarei com uma série de observações sobre essa situação, cada uma interessada por si mesma. Uma ferramenta básica é a sequência de vetores para Escrevendo cada momento pode ser expresso como um produto vetorialxk=(xk1,xk2,…,xkn)k=0,1,…,n−1.p=(p1,p2,…,pn),
μk=∑i=1npixki=px′k.
A coleção é linearmente independente. {x0,x1,…,xn−1} Para mostrar isso, assuma o contrário: ou seja, permita que os coeficientes nem todos sejam zero de tal modo que Escrito componente por componente, afirma que para cada Isso exibe cada como raiz do polinômioTal polinômio tem no máximo raízes distintas, contradizendo a distinção dock∑k=0n−1ckxk=0.(1)
(1)i=1,2,…,n, ∑k=0n−1ckxki=0.
xic(T)=cn−1Tn−1+cn−2Tn−2+⋯+c0.deg(c)≤n−1n xi.
Todos os momentos são determinados pelos primeiros momentosnμ0,μ1,…,μn−1. O resultado anterior mostra que os vetores são uma base para Portanto, para qualquer é uma combinação linear deou seja, existem coeficientes (determinados exclusivamente pelo ) para os quais ConsequentementeX={xk,k=0,1,…,n−1},Rn.m, xmxk, k=0,1,…,n−1;makxixm=ma0x0+ma1x1+⋯+man−1xn−1.
μm=px′m=p∑i=0n−1makx′k=∑i=0n−1makpx′k=∑i=0n−1makμk.
Os números e os primeiros momentos determinamxinp. De fato, os primeiros momentos são os coeficientes de na base dupla denpX.
Os primeiros momentos de determinam e são determinados pela distribuição deslocada por uma constantenFλ. Essa é a distribuição suportada em com probabilidades A demonstração é direta: use o teorema do para expandir em termos dex1−λ,x2−λ,…,xn−λpi.(xi−λ)kx0i,x1i,…,xki.
Parte da pergunta é, se existem um vector de probabilidade positiva e pontos de suporte determinando uma distribuição possuindo a mesmos momentos que Suponha que exista. Mude ambas as distribuições por simplificando a situação para distribuições com suporte não negativo . Ao assumir arbitrariamente grande, os maiores pontos de suporte acabam dominando os momentos: Isso só é possível quando en′,q,y1<y2<…<yn′,GF.λ=−min(x1,y1),mqn′ymn′≈μm≈pnxmn
qn′=pnyn′=xn. Continuando indutivamente, concluímos e isto é,n=n′, q=p,x1=y1:G=F.
Por fim, quantos momentos precisam ser conhecidos para determinar e ? Considere o mapa definido porSua derivada é a matrizpxf:Rn×Rn≈R2n→R2nf(p′,x′)=(px′0,px′1,…,px′2n−1)′.
2n×2n
Df(p′,x′)=⎛⎝⎜⎜⎜⎜⎜⎜⎜1x1x21⋮x2n−11⋯⋯⋯⋯⋯1xnx2n⋮x2n−1n0p12p1x1⋮(2n−1)p1x2n−21⋯⋯⋯⋯⋯0pn2pnxn⋮(2n−1)pnx2n−2n⎞⎠⎟⎟⎟⎟⎟⎟⎟
com uma estrutura semelhante a Vandermonde, permitindo obter uma fórmula simples para seu determinante,
Det(Df(p′,x′))=−(p1p2⋯pn)2n(∏1≤i<j≤n(xi−xj))4.
Como nenhum dos é zero e todos os são distintos, isso é diferente de zero. O teorema da função inversa implica que é invertível localmente: ou seja, desde que esteja no intervalo de , existe um inverso em uma vizinhança de Isso é,pixifμ=(μ0,μ1,…,μ2n−1)ff−1⊂Rn×Rnμ.
Os primeiros momentos determinam um conjunto discreto de soluções correspondentes a esses momentos.2nμ0,μ1,…,μ2n−1(p,x)
Como já mostramos, todas essas soluções correspondem à mesma distribuição: elas diferem apenas ao permutar os índices das variáveis.1,2,…,n