Se bem entendi, uma Análise Discriminante Linear (LDA) assume dados distribuídos normais, recursos independentes e covariâncias idênticas para todas as classes, para o critério de otimização.
Como a média e a variação são estimadas a partir dos dados de treinamento, isso já não é uma violação?
Encontrei uma citação em um artigo (Li, Tao, Shenghuo Zhu e Mitsunori Ogihara. “ Usando análise discriminante para classificação de várias classes: uma investigação experimental .” Knowledge and Information Systems 10, n. 4 (2006): 453–72 .)
"a análise discriminante linear freqüentemente alcança bons desempenhos nas tarefas de reconhecimento de faces e objetos, mesmo que as suposições da matriz de covariância comum entre os grupos e a normalidade sejam frequentemente violadas (Duda, et al., 2001)"
- infelizmente, não encontrei a seção correspondente em Duda et. al. "Classificação de padrões".
Alguma experiência ou opinião sobre o uso de LDA (vs. LDA ou QDA regularizado) para dados não normais em contexto de redução de dimensionalidade?