Nos métodos de agrupamento, como médias K , a distância euclidiana é a métrica a ser usada. Como resultado, calculamos apenas os valores médios em cada cluster. E então são feitos ajustes nos elementos com base em sua distância para cada valor médio.
Fiquei me perguntando por que a função gaussiana não é usada como métrica? Em vez de usar xi -mean(X)
, podemos usar exp(- (xi - mean(X)).^2/std(X).^2)
. Portanto, não apenas a similaridade entre os clusters é medida (média), mas a similaridade dentro do cluster também é considerada (std). Isso também é equivalente ao modelo de mistura gaussiano ?
Está além da minha pergunta aqui, mas acho que a mudança de média pode surgir a mesma pergunta acima.