Desejo testar algumas das minhas idéias que considero melhores do que qualquer coisa que já vi. Eu posso estar errado, mas gostaria de testar minhas idéias e vencer minhas dúvidas com mais observações certas.
O que eu tenho pensado em fazer é o seguinte:
- Analiticamente, defina um conjunto de distribuições. Alguns deles são fáceis, como Gaussian, uniforme ou Tophat. Mas alguns deles devem ser difíceis e desafiadores, como a distribuição dos Simpsons.
- Implemente software com base nessas distribuições analíticas e use-os para gerar algumas amostras.
- Como as distribuições são definidas analiticamente, eu já, por definição, conheço seus verdadeiros PDFs. Isso é ótimo.
- Em seguida, testarei os seguintes métodos de estimativa de PDF com base nas amostras acima:
- Métodos de estimativa de PDF existentes (como o KDE com vários kernels e larguras de banda).
- Minha própria idéia que acho que vale a pena tentar.
- Depois, medirei o erro das estimativas com relação aos PDFs verdadeiros.
- Então, vou saber melhor qual dos métodos de estimativa de PDF é bom.
Minhas perguntas são:
- Q1: existem melhorias no meu plano acima?
- P2: Acho difícil definir analiticamente muitos PDFs verdadeiros. Já existe uma lista abrangente de muitos PDFs verdadeiros definidos analiticamente com dificuldades variadas (incluindo muito difíceis) que posso reutilizar aqui?