Os jacobianos - os determinantes absolutos da mudança de função variável - parecem formidáveis e podem ser complicados. No entanto, eles são uma parte essencial e inevitável do cálculo de uma mudança multivariada de variável. Parece que não há nada a fazer além de escrever uma matriz de derivadas k+1 por k+1 e fazer o cálculo.
Existe uma maneira melhor. É mostrado no final da seção "Solução". Como o objetivo deste post é apresentar aos estatísticos o que pode ser um novo método para muitos, grande parte dele é dedicado à explicação do mecanismo por trás da solução. Esta é a álgebra de formas diferenciais . (Formas diferenciais são as coisas que se integram em várias dimensões.) Um exemplo detalhado e trabalhado é incluído para ajudar a tornar isso mais familiar.
fundo
Há mais de um século, os matemáticos desenvolveram a teoria da álgebra diferencial para trabalhar com as "derivadas de ordem superior" que ocorrem na geometria multidimensional. O determinante é um caso especial dos objetos básicos manipulados por essas álgebras, que normalmente são formas multilineares alternadas . A beleza disso reside em quão simples os cálculos podem se tornar.
Aqui está tudo o que você precisa saber.
Um diferencial é uma expressão da forma " dxi ". É a concatenação de " d " com qualquer nome de variável.
Uma forma única é uma combinação linear de diferenciais, como dx1+dx2 ou mesmo . Ou seja, os coeficientes são funções das variáveis.x2dx1−exp(x2)dx2
Os formulários podem ser "multiplicados" usando um produto de cunha , escrito . Este produto é anti-comutativo (também chamado de alternância ): para quaisquer duas formas únicas ω e η ,∧ωη
ω∧η=−η∧ω.
Essa multiplicação é linear e associativa: em outras palavras, funciona da maneira familiar. Uma conseqüência imediata é que , implicando que o quadrado de qualquer forma única é sempre zero. Isso torna a multiplicação extremamente fácil!ω∧ω=−ω∧ω
Para fins de manipulação dos integrandos que aparecem nos cálculos de probabilidade, uma expressão como pode ser entendida como | ddx1dx2⋯dxk+1.|dx1∧dx2∧⋯∧dxk+1|
Quando é uma função, então seu diferencial é dado por diferenciação:y=g(x1,…,xn)
dy=dg(x1,…,xn)=∂g∂x1(x1,…,xn)dx1+⋯+∂g∂x1(x1,…,xn)dxn.
A conexão com os jacobianos é a seguinte: o jacobiano de uma transformação é, até o momento, simplesmente o coeficiente de d x(y1,…,yn)=F(x1,…,xn)=(f1(x1,…,xn),…,fn(x1,…,xn)) que aparece na computaçãodx1∧⋯∧dxn
dy1∧⋯∧dyn=df1(x1,…,xn)∧⋯∧dfn(x1,…,xn)
depois de expandir cada um dos como uma combinação linear dos d x j na regra (5).dfidxj
Exemplo
A simplicidade dessa definição de jacobiana é atraente. Ainda não está convencido de que vale a pena? Considere o conhecido problema de converter integrais bidimensionais de coordenadas cartesianas em coordenadas polares ( r , θ ) , onde ( x , y ) = ( r cos(x,y)(r,θ) . A seguir, é uma aplicação totalmente mecânica das regras anteriores, onde " ( ∗ )(x,y)=(rcos(θ),rsin(θ))(∗)"é usado para abreviar expressões que obviamente desaparecerão em virtude da regra (3), que implica em .dr∧dr=dθ∧dθ=0
dxdy=|dx∧dy|=|d(rcos(θ))∧d(rsin(θ))|=|(cos(θ)dr−rsin(θ)dθ)∧(sin(θ)dr+rcos(θ)dθ|=|(∗)dr∧dr+(∗)dθ∧dθ−rsin(θ)dθ∧sin(θ)dr+cos(θ)dr∧rcos(θ)dθ|=|0+0+rsin2(θ)dr∧dθ+rcos2(θ)dr∧dθ|=|r(sin2(θ)+cos2(θ))dr∧dθ)|=r drdθ.
O ponto disso é a facilidade com que esses cálculos podem ser executados, sem mexer com matrizes, determinantes ou outros objetos multi-indiciais. Você apenas multiplica as coisas, lembrando que as fatias são anti-comutativas. É mais fácil do que o que é ensinado na álgebra do ensino médio.
Preliminares
Vamos ver essa álgebra diferencial em ação. Em este problema, o PDF da distribuição conjunta de é o produto dos PDF individuais (porque o X i são assumidos como sendo independente). Para lidar com a mudança nas variáveis Y i , devemos ser explícitos sobre os elementos diferenciais que serão integrados. Estes formam o termo d x 1 d x 2 ⋯ d x k + 1(X1,X2,…,Xk+1)XiYidx1dx2⋯dxk+1. Including the PDF gives the probability element
fX(x,α)dx1⋯dxk+1∝(xα1−11exp(−x1))⋯(xαk+1−1k+1exp(−xk+1))dx1⋯dxk+1=xα1−11⋯xαk+1−1k+1exp(−(x1+⋯+xk+1))dx1⋯dxk+1.
(The normalizing constant has been ignored; it will be recovered at the end.)
Staring at the definitions of the Yi a few seconds ought to reveal the utility of introducing the new variable
Z=X1+X2+⋯+Xk+1,
giving the relationships
Xi=YiZ.
This suggests making the change of variables xi→yiz in the probability element. The intention is to retain the first k variables y1,…,yk along with z and then integrate out z. To do so, we have to re-express all the dxi in terms of the new variables. This is the heart of the problem. It's where the differential algebra takes place. To begin with,
dxi=d(yiz)=yidz+zdyi.
Note that since Y1+Y2+⋯+Yk+1=1, then
0=d(1)=d(y1+y2+⋯+yk+1)=dy1+dy2+⋯+dyk+1.
Consider the one-form
ω=dx1+⋯+dxk=z(dy1+⋯+dyk)+(y1+⋯+yk)dz.
It appears in the differential of the last variable:
dxk+1=zdyk+1+yk+1dz=−z(dy1+⋯+dyk)+(1−y1−⋯yk)dz=dz−ω.
The value of this lies in the observation that
dx1∧⋯∧dxk∧ω=0
because, when you expand this product, there is one term containing dx1∧dx1=0 as a factor, another containing dx2∧dx2=0, and so on: they all disappear. Consequently,
dx1∧⋯∧dxk∧dxk+1=dx1∧⋯∧dxk∧z−dx1∧⋯∧dxk∧ω=dx1∧⋯∧dxk∧z.
Whence (because all products dz∧dz disappear),
dx1∧⋯∧dxk+1=(zdy1+y1dz)∧⋯∧(zdyk+ykdz)∧dz=zkdy1∧⋯∧dyk∧dz.
The Jacobian is simply |zk|=zk, the coefficient of the differential product on the right hand side.
Solution
The transformation (x1,…,xk,xk+1)→(y1,…,yk,z) is one-to-one: its inverse is given by xi=yiz for 1≤i≤k and xk+1=z(1−y1−⋯−yk). Therefore we don't have to fuss any more about the new probability element; it simply is
(zy1)α1−1⋯(zyk)αk−1(z(1−y1−⋯−yk))αk+1−1exp(−z)|zkdy1∧⋯∧dyk∧dz|=(zα1+⋯+αk+1−1exp(−z)dz)(yα1−11⋯yαk−1k(1−y1−⋯−yk)αk+1−1dy1⋯dyk).
That is manifestly a product of a Gamma(α1+⋯+αk+1) distribution (for Z) and a Dirichlet(α) distribution (for (Y1,…,Yk)). In fact, since the original normalizing constant must have been a product of Γ(αi), we deduce immediately that the new normalizing constant must be divided by Γ(α1+⋯+αk+1), enabling the PDF to be written
fY(y,α)=Γ(α1+⋯+αk+1)Γ(α1)⋯Γ(αk+1)(yα1−11⋯yαk−1k(1−y1−⋯−yk)αk+1−1).