Em primeiro lugar, acho que a des correlação e o clareamento são dois procedimentos separados.
Para desassociar os dados, precisamos transformá-los para que os dados transformados tenham uma matriz de covariância diagonal. Essa transformação pode ser encontrada resolvendo o problema de autovalor. Encontramos os autovetores e os autovalores associados da matriz de covariância , resolvendoΣ = X X′
Σ & Phi; = & Phi; Ganhe muitos
onde é uma matriz diagonal tendo os autovalores como seus elementos diagonais.Λ
A matriz diagonaliza assim a matriz de covariância de X . As colunas de Φ são os autovetores da matriz de covariância.ΦXΦ
Também podemos escrever a covariância diagonalizada como:
Φ′Σ Φ = Λ(1)
xEu
x∗Eu= Φ′xEu2)
Λ
Λ- 1 / 2Λ Λ- 1 / 2= I
( 1 )
Λ- 1 / 2Φ′Σ Φ Λ- 1 / 2= I
x∗Eux†Eu
x†Eu= Λ- 1 / 2x∗Eu= Λ- 1 / 2Φ′xEu(3)
x†Eux†EuE ( x†Eux†Eu′) = I
Σ
E, finalmente, há uma "pegadinha" comum com a qual as pessoas devem ter cuidado. É preciso ter cuidado para calcular os fatores de escala nos dados de treinamento e, em seguida, usar as equações (2) e (3) para aplicar os mesmos fatores de escala aos dados de teste; caso contrário, você corre o risco de sobreajustar (você usaria informações do conjunto de testes no processo de treinamento).
Fonte: http://courses.media.mit.edu/2010fall/mas622j/whiten.pdf