Eu tenho várias distribuições (10 distribuições na figura abaixo).
De fato, estes são histogramas: existem 70 valores no eixo x, que são os tamanhos de algumas partículas em uma solução e para cada valor de x o valor correspondente de y é a proporção de partículas cujo tamanho é em torno do valor de x.
Eu gostaria de agrupar essas distribuições. Atualmente, uso um cluster hierárquico com a distância euclidiana, por exemplo. Não estou satisfeito com a escolha da distância. Eu tentei a distância teórica da informação, como Kullback-Leibler, mas há muitos zeros nos dados e isso causa dificuldades. Você tem uma proposta de uma distância apropriada e / ou outro método de agrupamento?