A notificação após a tabela ANOVA após a análise de médias K indica que os níveis de significância não devem ser encarados como teste de médias iguais, pois a solução de cluster foi derivada com base na distância euclidiana para maximizar a distância. Que teste devo usar para mostrar se as médias das variáveis de clustering diferem entre os clusters? Eu vi esse aviso na tabela ANOVA fornecida pelas saídas k-means, mas em algumas referências vejo que os testes post-hoc ANOVA são executados. Devo ignorar as saídas ANOVA k-mean e executar a ANOVA unidirecional com testes post-hoc e interpretá-las da maneira tradicional? Ou posso apenas sugerir a magnitude do valor F e quais variáveis contribuíram mais para a diferença? Outra confusão é que as variáveis de agrupamento não são normalmente distribuídas, violando a suposição de ANOVA, então eu poderia usar o teste não paramétrico de Kruskal-Wallis, mas ele pressupõe as mesmas distribuições. As distribuições inter-cluster para as variáveis específicas não parecem iguais, algumas são distorcidas positivamente, outras são negativas ... Eu tenho 1275 amostras grandes, 5 clusters, 10 variáveis de cluster medidas nas pontuações PCA.