Estou tentando entender melhor a estimativa da densidade do kernel.
Usando a definição da Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition
Vamos considerar como uma função retangular que fornece se estiver entre e e , caso contrário, e (tamanho da janela) como 1.1 x - 0,5 0,5 0 h
Entendo que a densidade é uma convolução de duas funções, mas não sei se sei definir essas duas funções. Um deles deve (provavelmente) ser uma função dos dados que, para cada ponto em R, nos dizem quantos pontos de dados temos nesse local (principalmente ). E a outra função provavelmente deve ser alguma modificação da função do kernel, combinada com o tamanho da janela. Mas não sei como defini-lo.
Alguma sugestão?
Abaixo está um exemplo de código R que (suspeito) replica as configurações definidas acima (com uma mistura de dois gaussianos en ), nas quais espero ver uma "prova" de que as funções a serem complicadas são como suspeitamos .
# example code:
set.seed(2346639)
x <- c(rnorm(50), rnorm(50,2))
plot(density(x, kernel='rectangular', width=1, n = 10**4))
rug(x)