Uma maneira de atribuir um peso a uma variável é alterando sua escala. O truque funciona para os algoritmos de cluster que você mencionou, viz. meios k, ligação média ponderada e ligação média.
Kaufman, Leonard e Peter J. Rousseeuw. " Localizando grupos nos dados: uma introdução à análise de cluster ." (2005) - página 11:
A escolha das unidades de medida gera pesos relativos das variáveis. Expressar uma variável em unidades menores levará a um intervalo maior para essa variável, o que terá um grande efeito na estrutura resultante. Por outro lado, ao padronizar, tenta-se dar a todas as variáveis um peso igual, na esperança de alcançar objetividade. Como tal, pode ser usado por um profissional que não possui conhecimento prévio. No entanto, pode muito bem ser que algumas variáveis sejam intrinsecamente mais importantes que outras em uma aplicação específica, e então a atribuição de pesos deve ser baseada no conhecimento do assunto (ver, por exemplo, Abrahamowicz, 1985).
Por outro lado, tem havido tentativas de conceber técnicas de agrupamento independentes da escala das variáveis (Friedman e Rubin, 1967). A proposta de Hardy e Rasson (1982) é buscar uma partição que minimize o volume total dos cascos convexos dos clusters. Em princípio, esse método é invariável em relação às transformações lineares dos dados, mas infelizmente não existe algoritmo para sua implementação (exceto por uma aproximação restrita a duas dimensões). Portanto, o dilema da padronização parece inevitável no momento e os programas descritos neste livro deixam a escolha para o usuário.
Abrahamowicz, M. (1985), O uso de informações não numéricas do pnon para medir dissimilaridades, artigo apresentado no Quarto Encontro Europeu da Sociedade Psychometric e das Sociedades de Classificação, 2-5 de julho, Cambridge (Reino Unido).
Friedman, HP e Rubin, J. (1967), Sobre alguns critérios invariantes para agrupar dados. J. Amer. Statist. ASSOC6., 2, 1159-1178.
Hardy, A. e Rasson, JP (1982), Une nouvelle approche des problemes of classification automatic, Statist. Anal. Donnies, 7, 41-56.