Estou fazendo uma estimativa da densidade do Kernel, com um conjunto de pontos ponderados (ou seja, cada amostra tem um peso que não é necessário), em N dimensões. Além disso, essas amostras estão apenas em um espaço métrico (ou seja, podemos definir uma distância entre elas), mas nada mais. Por exemplo, não podemos determinar a média dos pontos da amostra, nem o desvio padrão, nem dimensionar uma variável em comparação com outra. O Kernel é afetado apenas por essa distância e o peso de cada amostra:
Neste contexto, estou tentando encontrar uma estimativa robusta para a largura de banda do kernel , possivelmente com variação espacial e, de preferência, que dê uma reconstrução exata no conjunto de dados de treinamento . Se necessário, poderíamos assumir que a função é relativamente suave.x i
Tentei usar a distância para o primeiro ou o segundo vizinho mais próximo, mas isso dá resultados muito ruins. Tentei com a otimização deixar de fora, mas tenho dificuldades em encontrar uma boa medida para otimizar nesse contexto no Nd, por isso encontra estimativas muito ruins, especialmente para as próprias amostras de treinamento. Não posso usar a estimativa gananciosa com base na suposição normal, pois não posso calcular o desvio padrão. Encontrei referências usando matrizes de covariância para obter núcleos anisotrópicos, mas, novamente, ele não se sustentaria neste espaço ...
Alguém tem uma ideia ou uma referência?