Eu estava brincando com os métodos PCA e LDA e estou em um ponto, sinto que é tão simples que não consigo vê-lo.
Matrizes de dispersão dentro da classe ( ) e entre classes ( S B ) são definidas como:
A matriz de dispersão total é dada como:
onde C é o número de classes e N é o número de amostras são amostras, μ i é a média da classe, μ é a média geral.
Ao tentar derivar eu vim até um ponto onde eu tive:
como um termo. Isso precisa ser zero, mas por quê?
De fato:
2
A resposta é que você está somando os desvios dos valores em torno da média e essa soma é zero. Mas o que, exatamente, são , m , e sou eu ? Como m e m i estão relacionados a μ e μ i ? A qualidade das respostas dependerá da precisão com que adivinhamos, mas você está nos forçando a adivinhar demais!
—
whuber
@ whuber: Você está totalmente certo, eu revisei minha pergunta.
—
Nimcap 23/03