A Análise de Classe Latente é de fato um Modelo de Mistura Finita (veja aqui ). A principal diferença entre o FMM e outros algoritmos de clustering é que o FMM oferece uma abordagem de "cluster baseado em modelo" que deriva clusters usando um modelo probabilístico que descreve a distribuição de seus dados. Portanto, em vez de encontrar clusters com alguma medida de distância escolhida arbitrariamente, use um modelo que descreva a distribuição de seus dados e, com base nesse modelo, avalie as probabilidades de que determinados casos sejam membros de determinadas classes latentes. Então, você poderia dizer que é uma abordagem de cima para baixo (você começa com a descrição da distribuição de seus dados), enquanto outros algoritmos de cluster são abordagens bastante de baixo para cima (você encontra semelhanças entre os casos).
Como você usa um modelo estatístico para a seleção do modelo de dados e a avaliação da qualidade do ajuste são possíveis - ao contrário do cluster. Além disso, se você presumir que existe algum processo ou "estrutura latente" subjacente à estrutura de seus dados, os FMMs parecem ser uma escolha apropriada, pois permitem modelar a estrutura latente atrás de seus dados (em vez de apenas procurar similaridades).
Outra diferença é que os FMMs são mais flexíveis que o clustering. Os algoritmos de agrupamento apenas agrupam, enquanto existem modelos baseados em FMM e LCA que
- permitem fazer análises confirmatórias entre grupos,
- combinar modelos da Teoria da resposta ao item (e outros) com ACV,
- incluem covariáveis para prever a associação de classe latente dos indivíduos,
- e / ou até modelos de regressão dentro do cluster na regressão de classe latente ,
- permitem modelar alterações ao longo do tempo na estrutura de seus dados etc.
Para mais exemplos, consulte:
Hagenaars JA e McCutcheon, AL (2009). Análise de Classe Latente Aplicada. Cambridge University Press.
ea documentação de flexmix e polca pacotes em R, incluindo os seguintes documentos:
Linzer, DA & Lewis, JB (2011). poLCA: Um pacote R para análise de classe latente de variáveis politômicas. Journal of Statistical Software, 42 (10), 1-29.
Leisch, F. (2004). Flexmix: Uma estrutura geral para modelos de mistura finita e regressão de vidro latente em R. Journal of Statistical Software, 11 (8), 1-18.
Grün, B. & Leisch, F. (2008). FlexMix versão 2: misturas finitas com variáveis concomitantes e parâmetros variáveis e constantes . Journal of Statistical Software, 28 (4), 1-35.
inferences
neste contexto e por que apenas as diferenças de inferência lhe interessam?