Modelos probabilísticos para mínimos quadrados parciais, regressão de classificação reduzida e análise de correlação canônica?


7

Esta questão resulta da discussão que se segue a uma pergunta anterior: Qual é a conexão entre mínimos quadrados parciais, regressão de classificação reduzida e regressão de componentes principais?

Para a análise de componentes principais, um modelo probabilístico comumente usado é

x=λwz+ϵRp,
que zN(0,1) , wSp1 , λ>0 e ϵN(0,Ip) . A covariância populacional de x é λwwT+Ip , ou seja,
xN(0,λwwT+Ip).
O objetivo é estimar w. Isso é conhecido como modelo de covariância cravada, que é frequentemente usado na literatura da PCA. O problema de estimar o verdadeiro w pode ser resolvido maximizando Var(Xw) sobre w na esfera da unidade.

Conforme apontado na resposta à pergunta anterior de @amoeba, a regressão de classificação reduzida, os mínimos quadrados parciais e a análise de correlação canônica têm formulações estreitamente relacionadas,

PCA:Var(Xw),RRR:Var(Xw)Corr2(Xw,Yv)Var(Yv),PLS:Var(Xw)Corr2(Xw,Yv)Var(Yv)=Cov2(Xw,Yv),CCA:Var(Xw)Corr2(Xw,Yv).

A questão é: quais são os modelos probabilísticos por trás do RRR, PLS e CCA? Em particular, estou pensando emComo depende de e em RRR, PLS e CCA? Além disso, existe um modelo probabilístico unificado (como o modelo de covariância cravada para PCA) para eles?

(xT,yT)TN(0,Σ).
Σwv

Olá @Moskowitz. Minha resposta está indo na direção que você esperava? Percebo que ela não responde totalmente à sua pergunta, mas ficaria feliz em receber algum feedback e também interessado em saber sua opinião sobre o assunto. Eu poderia estender minha descrição do PCCA, se você quiser; "PPLS" inexistente é algo em que venho pensando há alguns anos e me pego pensando novamente. Então, seria curioso ouvir seus pensamentos sobre isso.
Ameba

Oi @amoeba. Muito obrigado pela resposta. Desculpe pelo atraso na resposta. Eu estive pensando em visualizar o PPLS como outro modelo de exibição múltipla, onde as duas variáveis ​​x têm distribuições diferentes, mas não foram bem-sucedidas. Vou tentar adicionar a sua resposta se eu posso descobrir;)
Minkov

Respostas:


6

A análise de correlação canônica probabilística (CCA probabilística, PCCA) foi introduzida em Bach & Jordan, 2005, Uma interpretação probabilística da análise de correlação canônica , vários anos após Tipping & Bishop apresentarem sua análise probabilística de componentes principais (PCA probabilística, PPCA).

Resumidamente, é baseado no seguinte modelo probabilístico:

zN(0,I)x|zN(Wxz+μx,Ψx)y|zN(Wyz+μy,Ψy)

Aqui covariâncias de ruído e são matrizes simétricas arbitrárias de classificação completa.ΨxΨy

Modelo gráfico PCCA

Se considerarmos a variável latente unidimensional , suponha que todas as médias sejam zero e combine e em um vetor, obtemos:zμx=μy=0xy

(xy)N(0,Σ),Σ=(wxwx+Ψxwxwywywxwywy+Ψy).

Bach & Jordan provaram que isso é equivalente ao CCA padrão. Especificamente, a solução de máxima verossimilhança (ML) é dada por onde são matrizes de covariância de amostra de ambos os conjuntos de dados, é o primeiro par de eixos canônicos e são arbitrários números (ambos entre e ), dando a primeira correlação canônica como um produto.

wi=Σiuimi,
Σiuimxmy=ρ101

Como você vê, não são diretamente iguais aos eixos do CCA, mas são dados por alguma transformação desses. Veja Bach & Jordan para mais detalhes.wi


Não tenho uma boa compreensão intuitiva do PCCA. Como você pode ver, a matriz de covariância cruzada entre e é modelada por , portanto, pode-se esperar ingenuamente que produza eixos PLS. A solução ML está, no entanto, relacionada aos eixos CCA. Provavelmente, isso se deve à estrutura diagonal do bloco de .XYwxwywiΨ=(Ψx00Ψy)

Não conheço nenhuma versão probabilística semelhante de RRR ou PLS e não consegui me apresentar a nenhuma delas. Observe que se é diagonal, obtemos FA no conjunto de dados combinado e, se é diagonal e isotrópico, obtemos PPCA no conjunto de dados combinado. Portanto, há uma progressão do CCA para o FA e para o PPCA, pois fica cada vez mais restrito. Não vejo que outras opções de possam ser razoáveis.ΨX+YΨΨ


Resumindo: o que significa "isotrópico" em sua penúltima sentença?
Gottfried Helms #

@Gottfried, isso significa que ele é diagonal e todos os elementos na diagonal são iguais, isto é . Vou editar para esclarecer. \P=σ2\I
Ameba

Entendo obrigado. Eu havia implementado uma estrutura desse tipo no meu programa pca / fator sem saber seu nome, com base em uma sugestão de S. Mulaik em seu livro de 1972. Bom saber ...
Gottfried Helms
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.