Transformação linear de uma variável aleatória por uma matriz retangular alta

Digamos que temos um vetor aleatório , extraído de uma distribuição com função de densidade de probabilidade . Se o transformarmos linearmente por uma matriz classificação completa para obter , a densidade de será dada por $\vec{X} \in \mathbb{R}^n$ $f_\vec{X}(\vec{x})$ $n \times n$ $A$ $\vec{Y} = A\vec{X}$ $\vec{Y}$

f_{\vec{Y}} (\vec{y}) = \frac{1}{| det A |} f_{\vec{X}} (A^{- 1} \vec{y}) .

$f_{\vec{Y}}(\vec{y}) = \frac{1}{\left|\det A\right|}f_{\vec{X}}(A^{-1}\vec{y}).$

Agora digamos que transformamos $\vec{X}$ vez de uma matriz , com , fornecendo . Claramente , mas "vive" de um subespaço dimensional . Qual é a densidade condicional de , dado que sabemos que ela está em ? $m \times n$ $B$ $m > n$ $\vec{Z} = B\vec{X}$ $Z \in \mathbb{R}^m$ $n$ $G \subset \mathbb{R}^m$ $\vec{Z}$ $G$

Meu primeiro impulso foi de usar o pseudo-inverso de $B$ . Se $B = U S V^T$ é a decomposição do valor singular de $B$ , em seguida, $B^+ = V S^+ U^T$ é a pseudo-inversa, onde $S^+$ é formado por inversão dos não-zero entradas da matriz diagonal $S$ . Imaginei que isso daria

f_{\vec{Z}} (\vec{z}) = \frac{1}{| \overset{+}{det} S |} f_{\vec{X}} (B^{+} \vec{z}),

$f_\vec{Z}(\vec{z}) = \frac{1}{\left|\det^+ S\right|} f_\vec{X}(B^+ \vec{z}),$ onde

\overset{+}{det} S

$\det^+ S$ quero dizer o produto dos valores singulares diferentes de zero.

Esse raciocínio concorda com a densidade de um normal singular (condicionado ao conhecimento de que a variável vive no subespaço apropriado) fornecido aqui e mencionado também aqui e neste post CrossValidated .

Mas não está certo! A constante de normalização está desativada. Um contra-exemplo (trivial) é dado considerando o seguinte caso: Com $X \sim \mathcal{N(0, 1)}$ , deixe

\vec{Y} = (\begin{matrix} 1 \\ 1 \end{matrix}) X = (\begin{matrix} X \\ X \end{matrix}) .

$\vec{Y} = \begin{pmatrix}1 \\ 1\end{pmatrix} X = \begin{pmatrix}X \\ X\end{pmatrix}.$ Aqui a matriz

B

$B$ de cima é apenas o vetor ones. Sua pseudo-inversa é

B^{+} = (\begin{matrix} 1 / 2 & 1 / 2 \end{matrix})

$B^+ = \begin{pmatrix}1/2 & 1/2\end{pmatrix}$ e

\overset{+}{det} B = \sqrt{2}

$\det^+ B = \sqrt{2}$ . O raciocínio acima sugere

f_{\vec{Y}} (\vec{y}) = \frac{1}{\sqrt{2 π} \sqrt{2}} \exp (- \frac{1}{2} {\vec{y}}^{T} (B^{+})^{T} B^{+} \vec{y}),

$f_\vec{Y}(\vec{y}) = \frac{1}{\sqrt{2\pi}\sqrt{2}}\exp\left(-\frac{1}{2}\vec{y}^T (B^+)^T B^+ \vec{y}\right),$ mas isso de fato se integra (na linha

y = x

$y = x$ ) a

\frac{1}{\sqrt{2}}

$\frac{1}{\sqrt{2}}$ . Sei que, nesse caso, você pode simplesmente soltar uma das entradas de

\vec{Y}

$\vec{Y}$ , mas quando

B

$B$ é muito maior, identificar o conjunto de entradas a ser descartado é irritante. Por que o raciocínio pseudo-inverso não funciona? Existe uma fórmula geral para a função densidade de uma transformação linear de um conjunto de variáveis aleatórias por uma matriz "alta"? Qualquer referência seria muito apreciada também.

— Dan
fonte

Para aqueles que podem se deparar com isso no futuro ... a origem do erro realmente decorre da integração. No exemplo acima, a integração ocorre sobre a linha . Portanto, é necessário "parametrizar" a linha e considerar o jacobiano da parametrização ao obter a integral, pois cada passo unitário no eixo corresponde a passos de comprimento na linha. A parametrização que eu estava usando implicitamente foi dada por , em outras palavras, especificando as duas entradas idênticas de por valor. Isso tem jacobiano , que cancela ordenadamente com o $y = x$ $x$ $\sqrt{2}$ $x \mapsto (x, x)$ $\vec{y}$ $\sqrt{2}$ $\sqrt{2}$ (provenientes exatamente do mesmo jacobiano) no denominador.

O exemplo foi artificialmente simples - para uma transformação geral , pode-se ter outra parametrização para a saída que é natural no contexto do problema. Como a parametrização precisa abranger o mesmo subespaço que e esse subespaço é um hiperplano, é provável que a parametrização seja linear. Chamando a representação matricial da parametrização , o requisito é simplesmente que ele tenha o mesmo espaço de coluna que (cubra o mesmo hiperplano). Então a densidade final se torna $B$ $G$ $B$ $m \times n$ $L$ $B$

f_{\vec{Z}} (\vec{z}) = \frac{| \overset{+}{det} L |}{| \overset{+}{det} B |} f_{\vec{X}} (B^{+} \vec{z}) .

$f_{\vec{Z}}(\vec{z}) = \frac{\left|\det^+ L\right|}{\left|\det^+ B\right|}f_{\vec{X}}(B^+ \vec{z}).$

Em geral, essa configuração é meio estranha, e acho que a coisa certa a fazer é encontrar um conjunto máximo de linhas linearmente independentes de e remover o restante das linhas (junto com os componentes correspondentes da variável transformada ) para obter uma matriz quadrada . Em seguida, o problema reduz-se ao caso classificação completa (supondo que tenha classificação de coluna completa). $B$ $\vec{z}$ $\hat B$ $n \times n$ $B$

— Dan
fonte