Estou pesquisando o uso do teste de significância estatística (SST) para validar os resultados da análise de cluster. Encontrei vários artigos sobre esse tópico, como
- " Significância estatística do agrupamento para dados de alta dimensão e tamanho de amostra baixo ", de Liu, Yufeng et al. (2008)
- " Em alguns testes de significância na análise de agrupamentos ", de Bock (1985)
Mas estou interessado em encontrar alguma literatura argumentando que o SST NÃO é apropriado para validar os resultados da análise de cluster. A única fonte que encontrei alegando que isso é uma página da Web de um fornecedor de software
Esclarecer:
Estou interessado em testar se uma estrutura significativa de clusters foi encontrada como resultado da análise de clusters. Portanto, gostaria de saber sobre documentos que apóiam ou refutam a preocupação "sobre a possibilidade de testes post-hoc dos resultados de dados exploratórios análise usada para encontrar clusters ".
Acabei de encontrar um artigo de 2003, " Métodos de agrupamento e classificação ", de Milligan e Hirtle , dizendo, por exemplo, que o uso da ANOVA seria uma análise inválida, pois os dados não têm atribuições aleatórias para os grupos.