Quais são os melhores métodos para ajustar o 'modo' de dados amostrados de uma distribuição contínua?
Como o modo é tecnicamente indefinido (certo?) Para uma distribuição contínua, estou realmente perguntando 'como você encontra o valor mais comum'?
Se você presumir que a distribuição pai é gaussiana, poderá bin os dados e encontrar, digamos, que o modo é o local da bin com maiores contagens. No entanto, como você determina o tamanho da bandeja? Existem implementações robustas disponíveis? (ou seja, robusto para valores extremos). Eu uso python
/ scipy
/ numpy
, mas provavelmente posso traduzir R
sem muita dificuldade.