No PCA, faz diferença se escolhermos os principais componentes da matriz de covariância inversa OU se deixarmos cair autovetores da matriz de covariância correspondentes a grandes valores próprios?
Isso está relacionado à discussão neste post .
No PCA, faz diferença se escolhermos os principais componentes da matriz de covariância inversa OU se deixarmos cair autovetores da matriz de covariância correspondentes a grandes valores próprios?
Isso está relacionado à discussão neste post .
Respostas:
Observe que, para a matriz de covariância definida positiva a precisão é Σ - 1 = U D - 1 U ' .
Portanto, os vetores próprios permanecem os mesmos, mas os valores próprios da precisão são os recíprocos dos valores próprios da covariância. Isso significa que os maiores valores próprios da covariância serão os menores valores próprios da precisão. Como você tem o inverso, a definição positiva garante que todos os autovalores sejam maiores que zero.
Portanto, se você reter os autovetores relacionados aos menores autovalores da precisão, isso corresponderá ao PCA comum. Como já tomamos os recíprocos ( D - 1 ), apenas a raiz quadrada dos autovalores de precisão deve ser usada para concluir o clareamento dos dados transformados.
Além disso, a matriz de covariância inversa é proporcional à correlação parcial entre os vetores:
Corr(Xi, Xj | (Xothers )
Correlação entre Xi e Xj quando todos os outros são corrigidos, é muito útil para séries temporais.