Entendo o que é "maldição da dimensionalidade", e resolvi alguns problemas de otimização dimensional e conheço o desafio das possibilidades exponenciais.
No entanto, duvido que a "maldição da dimensionalidade" exista na maioria dos dados do mundo real (bem, vamos deixar imagens ou vídeos de lado por um momento, estou pensando em dados como dados demográficos do cliente e dados de comportamento de compra).
Podemos coletar dados com milhares de recursos, mas é menos provável que até mesmo os recursos possam abranger totalmente um espaço com milhares de dimensões. É por isso que as técnicas de redução de dimensão são tão populares.
Em outras palavras, é muito provável que os dados não contenham o nível exponencial de informações, ou seja, muitos recursos são altamente correlacionados e muitos atendem às regras 80-20 (muitas instâncias têm o mesmo valor).
Nesse caso, acho que métodos como o KNN ainda funcionarão razoavelmente bem. (Na maioria dos livros, "maldição da dimensionalidade" diz que a dimensão> 10 pode ser problemática. Em suas demonstrações, eles usam distribuição uniforme em todas as dimensões, onde a entropia é realmente alta. Duvido que no mundo real isso aconteça.)
Minha experiência pessoal com dados reais é que a "maldição da dimensionalidade" não afeta muito o método do modelo (como o KNN) e, na maioria dos casos, as dimensões ~ 100 ainda funcionariam.
Isso é verdade para outras pessoas? (Trabalhei com dados reais em diferentes setores por 5 anos, nunca observei "todos os pares de distâncias têm valores semelhantes", conforme descrito no livro.)