Existe algum motivo específico para você escolher a estimativa da densidade do kernel em vez da estimativa paramétrica? Eu estava aprendendo a ajustar a distribuição aos meus dados. Esta pergunta veio a mim.
Meu tamanho de dados é relavamente grande com 7500 pontos de dados. Reivindicações automáticas. Meu objetivo é ajustá-lo a uma distribuição (não paramétrica ou paramétrica). Em seguida, use-o para simular dados de reivindicação automática e calcular o VaR ou TVaR.
Eu usei o log para transformar os dados para torná-los relativamente normais. Eu ajustei muitas distribuições, incluindo normal, lognormal, gama, t, etc ... Eu usei AIC e loglikehood para identificar o melhor ajuste. Mas nada disso foi aprovado no teste KS (valor p extremamente pequeno, com e-10).
Por isso perguntei em que situação eu deveria mudar para o KDE.