Antecedentes: Existem algumas ótimas perguntas / respostas aqui sobre como calibrar modelos que preveem as probabilidades de um resultado acontecer. Por exemplo
- Brier score , e sua decomposição em resolução, incerteza e confiabilidade .
- Gráficos de calibração e regressão isotônica .
Esses métodos geralmente exigem o uso de um método de binning nas probabilidades previstas, para que o comportamento do resultado (0, 1) seja suavizado sobre o bin, obtendo o resultado médio.
Problema: No entanto, não consigo encontrar nada que me instrua sobre como escolher a largura da bandeja.
Pergunta: Como escolho a largura ideal da bandeja?
Tentativa: Duas larguras comuns de compartimento em uso parecem ser:
- Binning de largura igual, por exemplo, 10 escaninhos, cada um cobrindo 10% do intervalo [0, 1].
- O método de bineamento de Tukey discutido aqui .
Mas essas escolhas das caixas são as mais ideais se alguém estiver interessado em encontrar intervalos nas probabilidades previstas mais mal calibradas?