De uma forma ou de outra, todo algoritmo de agrupamento depende de alguma noção de "proximidade" de pontos. Parece intuitivamente claro que você pode usar uma noção relativa (invariável à escala) ou uma noção absoluta (consistente) de proximidade, mas não as duas .
Primeiro tentarei ilustrar isso com um exemplo, e depois continuarei dizendo como essa intuição se encaixa no Teorema de Kleinberg.
Um exemplo ilustrativo
Suponha que temos dois conjuntos e S 2 de 270 pontos cada, organizados no plano assim:S1S2270
Você pode não ver pontos em nenhuma dessas fotos, mas isso ocorre porque muitos dos pontos estão muito próximos. Vemos mais pontos quando aumentamos o zoom:270
Você provavelmente concordará espontaneamente que, em ambos os conjuntos de dados, os pontos são organizados em três grupos. No entanto, acontece que, se você ampliar um dos três grupos de , verá o seguinte:S2
Se você acredita em uma noção absoluta de proximidade, ou na consistência, você ainda sustentam que, independentemente do que você acabou de ver sob o microscópio, consiste em apenas três clusters. De fato, a única diferença entre S 1 e S 2 é que, dentro de cada cluster, alguns pontos estão agora mais próximos. Se, por outro lado, você acredita em uma noção relativa de proximidade ou em invariância de escala, sente-se inclinado a argumentar que S 2 consiste não de 3, mas de 3 × 3 = 9 aglomerados. Nenhum desses pontos de vista está errado, mas você precisa fazer uma escolha de uma maneira ou de outra.S2S1S2S233 × 3 = 9
Um caso de invariância isométrica
Se você comparar a intuição acima com o Teorema de Kleinberg, descobrirá que elas estão ligeiramente em desacordo. De fato, o Teorema de Kleinberg parece dizer que você pode obter invariância e consistência de escala simultaneamente, desde que não se importe com uma terceira propriedade chamada riqueza. No entanto, a riqueza não é a única propriedade a ser perdida se você insistir simultaneamente na invariância e consistência da escala. Você também perde outra propriedade mais fundamental: invariância isométrica. Esta é uma propriedade que eu não estaria disposto a sacrificar. Como não aparece no artigo de Kleinberg, vou me debruçar sobre isso por um momento.
Em resumo, um algoritmo de agrupamento é isométrico invariante se sua saída depende apenas das distâncias entre os pontos, e não de algumas informações adicionais, como etiquetas que você anexa aos seus pontos ou de uma ordem que você impõe aos seus pontos. Espero que isso pareça uma condição muito leve e muito natural. Todos os algoritmos discutidos no artigo de Kleinberg são isométricos invariantes, exceto o algoritmo de ligação única com a condição de parada do cluster . De acordo com a descrição de Kleinberg, esse algoritmo usa uma ordem lexicográfica dos pontos, portanto sua saída pode realmente depender de como você os rotula. Por exemplo, para um conjunto de três pontos equidistantes, a saída do algoritmo de ligação única com os 2k2A condição de parada do cluster fornecerá respostas diferentes, dependendo de você rotular seus três pontos como "gato", "cachorro", "rato" (c <d <m) ou como "Tom", "Spike", "Jerry" (J <S <T):
É claro que esse comportamento não natural pode ser facilmente reparado substituindo a condição de parada do cluster por uma “condição de parada do cluster k ( ≤ k ) ”. A idéia é simplesmente não romper os laços entre pontos equidistantes e parar de fundir clusters assim que atingirmos o máximo de k clusters. Esse algoritmo reparado ainda produzirá k clusters na maioria das vezes, e será isométrico invariante e escalar invariante. De acordo com a intuição acima, ela não será mais consistente.k( ≤ k ) kk
SSS
Γ :{métricas em S} → { partições de S}d↦ y ( d)
Eudd′Si : S→ Sd′( i ( x ) , i ( y) ) = d( x , y)xyS
Definição: Um algoritmo de agrupamento é isométrica invariante se satisfizer a seguinte condição: para qualquer métrica e e qualquer isometria entre elas, os pontos e estão no mesmo cluster de se e somente se os pontos originais e estiverem no mesmo agrupamento de .Γdd′ii(x)i(y)Γ(d′)xyΓ(d)
Quando pensamos em algoritmos de agrupamento, geralmente identificamos o conjunto abstrato com um conjunto concreto de pontos no plano ou em algum outro espaço ambiente e imaginamos variar a métrica em ao mover os pontos de ao redor. De fato, esse é o ponto de vista que adotamos no exemplo ilustrativo acima. Nesse contexto, invariância isométrica significa que nosso algoritmo de agrupamento é insensível a rotações, reflexões e traduções.SSS
Uma variante do Teorema de Kleinberg
A intuição dada acima é capturada pela seguinte variante do Teorema de Kleinberg.
Teorema: Não existe um algoritmo de agrupamento não trivial e invariante em isometria que seja simultaneamente consistente e invariável em escala.
Aqui, por um algoritmo de agrupamento trivial , quero dizer um dos dois algoritmos a seguir:
S
S
A alegação é que esses algoritmos tolos são os únicos dois algoritmos invariantes de isometria que são consistentes e invariáveis em escala.
SΓd₁Sd₁(x,y)=1x≠yΓ Γ ( d ₁ ) Γ ( d ₁ ) Γ (SΓΓ(d₁)Γ(d₁)Γ(d₁)Γ(d₁)é a partição discreta. Dada qualquer métrica em , podemos redimensioná-la para que todos os pares de pontos tenham distância sob . Então, por consistência, encontramos que . Portanto, nesse caso, é o algoritmo trivial que atribui a partição discreta a cada métrica. Segundo, vamos considerar o caso em que é a partição global. Podemos redimensionar qualquer métrica em para que todos os pares de pontos tenham distância , então novamente a consistência implica que . Então também é trivial neste caso. ∎dS≥1dΓ(d)=Γ(d₁)ΓΓ(d₁)dS≤1Γ(d)=Γ(d₁)Γ
Evidentemente, essa prova está muito próxima da prova de Margareta Ackerman do teorema original de Kleinberg, discutida na resposta de Alex Williams.