Como você explicaria a Função de Geração de Momento (MGF) nos termos do leigo?


15

O que é uma função geradora de momento (MGF)?

Você pode explicar isso em termos leigos e junto com um exemplo simples e fácil?

Por favor, limite o uso de anotações matemáticas formais, tanto quanto possível.


1
Você quer um exemplo simples e fácil ... mas sem notação matemática? Não tenho certeza se isso seria muito fácil de fazer - pelo menos não sem arriscar dar uma impressão enganosa do que você está lidando. Suponho que alguém possa fornecer o mgf de uma variável aleatória degenerada que é sempre 0 0 sem precisar muito da notação matemática, mas será pouco esclarecedor se você realmente quiser entender o mgfs.
Glen_b -Reinstala Monica

1
Não tenho certeza se existe uma maneira intuitiva de entendê-la; você pode pensar nela como uma forma de "codificar" uma distribuição (pelo menos quando existe, essa ideia funciona um pouco melhor com funções características).
dsaxton

1
Uma função geradora de momento - quando existe - é uma maneira de codificar todos os momentos inteiros não negativos de uma variável aleatória em uma função e da qual eles podem ser extraídos novamente; mgfs pode ser usado para fazer cálculos específicos que às vezes não são tão fáceis de fazer de outras maneiras. Não espero que seja de muita ajuda.
Glen_b -Reinstala Monica

1
Eu estou certo que você viu resposta Joe Blitztein à questão idêntica no Quora
Antoni Parellada

Respostas:


18

Vamos supor que uma intuição sem equação não seja possível e ainda insistir em resumir a matemática ao essencial para ter uma idéia do que está acontecendo: estamos tentando obter os momentos estatísticos que, após a referência obrigatória à física , definimos como o valor esperado de uma potência de uma variável aleatória. Para uma variável aleatória contínua, o k ésimo momento bruto é por LOTUS :

(1)E[Xk]=-Xkpdfdx

A função geradora de momento ,

MX(t): =E[etX],
é uma maneira de contornar essa integral (Eq.1) , executando:

2)E[etX]=-etXpdfdx

Por quê? Porque é mais fácil e há uma fantástica propriedade da MGF que pode ser visto através da expansão das série de Maclaurin de etX

etX=1+X1!t+X22!t2+X33!t3+

Tomando a expectativa de ambos os lados desta série de potências:

MX(t)=E[etX](3)=1+E[X]1!t+E[X2]2!t2+E[X3]3!t3+

os momentos aparecem "empoleirados" neste "varal" polinomial, pronto para ser descartado simplesmente diferenciando k vezes e avaliando em zero uma vez que passamos pela integração mais fácil (na eq. (2)) apenas uma vez por todos os momentos! O fato de ser uma integração mais fácil é mais aparente quando o pdf é exponencial.

Para recuperar o k ésimo momento:

MX(k)(0 0)=dkdtkMX(t)|t=0 0

O fato de, eventualmente, haver uma necessidade de diferenciar o torna um almoço não gratuito - no final, é uma transformação Laplace bilateral do pdf com um sinal alterado no expoente:

L{pdf(x)}(s)=esxpdf(x)dx

de modo que

(4)MX(t)=L{pdf(x)}(s).

Com efeito, isso nos dá uma avenida da física para a intuição. A transformação de Laplace está atuando no pdf e decompondo-o em momentos. A semelhança com uma transformação de Fourier é inevitável : um FT mapeia uma função para uma nova função na linha real e Laplace mapeia uma função para uma nova função no plano complexo. A transformada de Fourier expressa uma função ou sinal como uma série de frequências, enquanto a transformada de Laplace resolve uma função em seus momentos . De fato, uma maneira diferente de obter momentos é através da transformação de Fourier ( função característica ). O termo exponencial na transformada de Laplace é geralmente da forma est coms=σ+iω , correspondendo aosexponenciais reais e sinusoidais imaginários, e produzindo gráficos comoeste:


[ Do guia do cientista e do engenheiro para processamento de sinais de Steven W. Smith ]


Portanto, a função MX(t) decompõe o pdf alguma forma em suas "frequências constituintes" quando σ=0. Da eq. (4)

MX(t)=E[esX]=esxpdf(x)dx=e(σ+iω)xpdf(x)dx=eσxeiωxpdf(x)dx

which leaves us with the improper integral of the part of the expression in red, corresponding to the Fourier transform of the pdf.

In general, the intuition of the Laplace transform poles of a function would be that they provide information of the exponential (decay) and frequency components of the function (in this case, the pdf).


In response to the question under comments about the switching from Xk to etx, this is a completely strategic move: one expression does not follow from the other. Here is an analogy: We have a car of our own and we are free to drive into the city every time we need to take care of some business (read, integrating Eq (1) no matter how tough for every separate, single moment). Instead, we can do something completely different: we can drive to the nearest subway station (read, solve Eq (2) just once), and from there use public transportation to reach every single place we need to visit (read, get any k derivative of the integral in Eq (2) to extract whichever k-th moment we need, knowing (thanks to Eq (3)) that all the moments are "hiding" in there and isolated by evaluating at 0).


2
How does E[etX] replace E[Xk]? (Out of the blue?)
user366312

2
I wish the laymen who understand this answer were my students :)
Aksakal

3

In the most layman terms it's a way to encode all characteristics of the probability distribution into one short phrase. For instance, if I know that MGF of the distribution is

M(t)=etμ+1/2σ2t2
I can find out the mean of this distribution by taking first term of Taylor expansion:
ddtM(t)|t=0=μ+σ2t|t=0=μ
If you know what you're doing it's much faster than taking the expectation of the probability function.

Moreover, since this MGF encodes everything about the distribution, if you know how to manipulate the function, you can apply operations on all characteristics of the distribution at once! Why don't we always use MGF? First, it's not in every situation the MGF is the easiest tool. Second, MGF doesn't always exist.

Above layman

Suppose you have a standard normal distribution. You can express everything you know about it by stating its PDF:

f(x)=12πex2/2

You can calculate its moment such as mean and standard deviation, and use it on transformed variables and functions on random normals etc.

You can think of the MGF of normal distribution as an alternative to PDF. It contains the same amount of information. I already showed how to obtain the mean.

Why do we need an alternative way? As I wrote, sometimes it's just more convenient. For instance, try calculating the variance of the standard normal from PDF:

σ2=x212πex2/2dx=?
It's not that difficult, but it's much easier to do it with MGF M(t)=et2/2:
σ2=d2dt2M(t)|t=0=ddtt|t=0=1


1
Can you please expand on the "everything" that it encodes about the distribution?
ColorStatistics

2
To appreciate the point made by @ColorStatistics, please see stats.stackexchange.com/questions/25010.
whuber

@whuber: Thank you, whuber. I'll study that reference. This is a topic I am looking to understand better.
ColorStatistics

How can we prove that MGF & PDF contain the same amount of information?
Aerin
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.