Tenho uma distribuição de valores obviamente bimodal, que procuro ajustar. Os dados podem ser ajustados bem com 2 funções normais (bimodal) ou com 3 funções normais. Além disso, há uma razão física plausível para ajustar os dados com 3.
Quanto mais parâmetros forem introduzidos, mais perfeito será o ajuste, como com constantes suficientes, pode-se " ajustar um elefante ".
Aqui está a distribuição, ajustada com a soma de 3 curvas normais (gaussianas):
Estes são os dados para cada ajuste. Não tenho certeza de qual teste devo aplicar aqui para determinar o ajuste. Os dados consistem em 91 pontos.
1 Função Normal:
- RSS: 1.06231
- X ^ 2: 3.1674
- F.Test: 0.3092
2 funções normais:
- RSS: 0.010939
- X ^ 2: 0,053896
- F.Test: 0.97101
3 funções normais:
- RSS: 0.00536
- X ^ 2: 0,02794
- F.Test: 0.99249
Qual é o teste estatístico correto que pode ser aplicado para determinar qual desses três ajustes é o melhor? Obviamente, o ajuste de 1 função normal é inadequado. Então, como posso discriminar entre 2 e 3?
Para adicionar, estou fazendo isso principalmente com o Excel e um pouco de Python; Ainda não tenho familiaridade com R ou outras línguas estatísticas.
R
rota). Alguns critérios de seleção de modelos são mencionados nesta resposta . Por fim, convém considerar métodos de ensemble , que abordamos brevemente nesta resposta , que também contém um link para informações focadas em Python. Você pode encontrar mais detalhes sobre a seleção do modelo e média em esta resposta .