Primeiro fornecerei uma explicação verbal e depois uma mais técnica. Minha resposta consiste em quatro observações:
Como @ttnphns explicou nos comentários acima, no PCA cada componente principal possui certa variação, que juntos somam 100% da variação total. Para cada componente principal, uma razão de sua variação para a variação total é chamada de "proporção da variação explicada". Isto é muito conhecido.
Por outro lado, na LDA, cada "componente discriminante" tem certa "discriminabilidade" (eu inventei esses termos!), E todas juntas somam 100% da "discriminação total". Assim, para cada "componente discriminante" pode-se definir "proporção de discriminabilidade explicada". Eu acho que a "proporção de rastreamento" a que você está se referindo é exatamente isso (veja abaixo). Isso é menos conhecido, mas ainda é comum.
Ainda assim, pode-se observar a variação de cada componente discriminante e calcular a "proporção de variação" de cada um deles. Acontece que eles somam algo que é inferior a 100%. Acho que nunca vi isso discutido em nenhum lugar, e esse é o principal motivo pelo qual desejo fornecer essa resposta longa.
Pode-se também dar um passo adiante e calcular a quantidade de variação que cada componente da LDA "explica"; isso vai ser mais do que apenas sua própria variação.
VamosTWBT=W+B
TTtr(T)
W−1BBWB/WW−1BW−1Btr(W−1B)
KNK−1K−1<N
No entanto, reluto em me referir a essas variações de componentes como "variações explicadas" (vamos chamá-las de "variações capturadas"). Para cada componente LDA, é possível calcular a quantidade de variação que pode explicar nos dados, regredindo os dados para esse componente; esse valor geralmente será maior que a variação "capturada" desse componente. Se houver componentes suficientes, juntos a variação explicada deve ser de 100%. Veja minha resposta aqui para saber como calcular essa variação explicada em um caso geral: Análise de componentes principais "invertida": quanta variação dos dados é explicada por uma dada combinação linear das variáveis?
79%21%96%4%48%26%74%65%35%
Captured varianceExplained varianceSignal-to-noise ratioLDA axis 148%65%96%LDA axis 226%35%4%PCA axis 179%79%−PCA axis 221%21%−
vW−1BBv=λWv
v⊤Bvv⊤Wv=BW
λ
W−1B=W−1/2W−1/2BW−1/2BW−1/2
v1v2Bv=λWvBWTT=W+Bv⊤1Tv2=0
VV⊤TV
tr(V⊤TV)<tr(T),