Eu quero agrupar ~ 22000 pontos. Muitos algoritmos de agrupamento funcionam melhor com suposições iniciais de maior qualidade. Quais ferramentas existem para me dar uma boa idéia da forma aproximada dos dados?
Eu quero poder escolher minha própria métrica de distância, para que um programa no qual eu possa alimentar uma lista de distâncias em pares seja ótimo. Gostaria de poder fazer algo como destacar uma região ou cluster no visor e obter uma lista de quais pontos de dados estão nessa área.
O software livre é preferido, mas eu já tenho SAS e MATLAB.