Qual é a justificativa, se houver, para usar a Análise Discriminante (DA) nos resultados de um algoritmo de agrupamento como k-means, como eu o vejo de tempos em tempos na literatura (essencialmente sobre subtipos clínicos de transtornos mentais)?
Geralmente, não é recomendável testar diferenças de grupo nas variáveis usadas durante a construção do cluster, pois elas suportam a maximização (resp. Minimização) da inércia entre classes (resp. Dentro da classe). Portanto, não tenho certeza de apreciar totalmente o valor agregado da DA preditiva, a menos que procuremos incorporar indivíduos em um espaço fatorial de menor dimensão e ter uma idéia da "generalização" de uma partição. Porém, mesmo nesse caso, a análise de cluster continua sendo fundamentalmente uma ferramenta exploratória; portanto, o uso da associação de classe calculada dessa maneira para derivar ainda mais uma regra de pontuação parece estranho à primeira vista.
Alguma recomendação, idéias ou sugestões para artigos relevantes?
R
: cran.r-project.org/web/packages/adegenet/vignettes/…