Por que o vizinho mais próximo baseado em árvore KD é exponencial em K?

Eu já li em muitos artigos na pesquisa de vizinhos mais próximos de dimensões mais altas que as árvores KD são exponenciais em K, mas não consigo determinar o porquê.

O que estou procurando é uma sólida análise de complexidade de tempo de execução que explique esse aspecto do problema.

— Akdom
fonte

O pensamento rápido é que essa ké efetivamente a dimensão do problema e, portanto, sofre com a "maldição da dimensionalidade".

— Michael Klein

kNN tende a ser exponencial porque o espaço de pesquisa aumenta com . Imagine dividir o espaço em torno do seu ponto de pesquisa em quadrantes. Para k = 1, basta procurar dois 'quadrantes' (valores superiores e inferiores), para k = 2 são 4 quadrantes, para k = 3 são 8 quadrantes, ou seja, crescimento exponencial do espaço de pesquisa. É disso que a árvore kD sofre, porque precisa procurar sub-ramificações. $2^k$ $2^k$

Outras árvores têm um desempenho muito melhor, por exemplo, o CoverTree . Também descobri que o PH-Tree funciona muito bem, parece demorar duas vezes mais que o CoverTree para conjuntos de dados entre k = 8 e k = 27 (eu não tinha conjuntos de dados com k mais alto).

— TilmannZ
fonte

Observe que você pode usar o LaTeX aqui para digitar matemática de uma maneira mais legível. Veja aqui uma breve introdução.

— Raphael