A análise de correlação canônica probabilística (CCA probabilística, PCCA) foi introduzida em Bach & Jordan, 2005, Uma interpretação probabilística da análise de correlação canônica , vários anos após Tipping & Bishop apresentarem sua análise probabilística de componentes principais (PCA probabilística, PPCA).
Resumidamente, é baseado no seguinte modelo probabilístico:
zx|zy|z∼N(0,I)∼N(Wxz+μx,Ψx)∼N(Wyz+μy,Ψy)
Aqui covariâncias de ruído e são matrizes simétricas arbitrárias de classificação completa.ΨxΨy
Se considerarmos a variável latente unidimensional , suponha que todas as médias sejam zero e combine e em um vetor, obtemos:zμx=μy=0xy
(xy)∼N(0,Σ),Σ=(wxw⊤x+Ψxwyw⊤xwxw⊤ywyw⊤y+Ψy).
Bach & Jordan provaram que isso é equivalente ao CCA padrão. Especificamente, a solução de máxima verossimilhança (ML) é dada por onde são matrizes de covariância de amostra de ambos os conjuntos de dados, é o primeiro par de eixos canônicos e são arbitrários números (ambos entre e ), dando a primeira correlação canônica como um produto.
wi=Σiuimi,
Σiuimxmy=ρ101
Como você vê, não são diretamente iguais aos eixos do CCA, mas são dados por alguma transformação desses. Veja Bach & Jordan para mais detalhes.wi
Não tenho uma boa compreensão intuitiva do PCCA. Como você pode ver, a matriz de covariância cruzada entre e é modelada por , portanto, pode-se esperar ingenuamente que produza eixos PLS. A solução ML está, no entanto, relacionada aos eixos CCA. Provavelmente, isso se deve à estrutura diagonal do bloco de .XYwxw⊤ywiΨ=(Ψx00Ψy)
Não conheço nenhuma versão probabilística semelhante de RRR ou PLS e não consegui me apresentar a nenhuma delas. Observe que se é diagonal, obtemos FA no conjunto de dados combinado e, se é diagonal e isotrópico, obtemos PPCA no conjunto de dados combinado. Portanto, há uma progressão do CCA para o FA e para o PPCA, pois fica cada vez mais restrito. Não vejo que outras opções de possam ser razoáveis.ΨX+YΨΨ