Embora esta questão e sua primeira resposta pareçam estar focadas em questões teóricas da calibração do modelo de regressão logística, a questão de:
Como alguém poderia arruinar a calibração de uma regressão logística ...?
merece alguma atenção com relação às aplicações do mundo real, para futuros leitores desta página. Não devemos esquecer que o modelo de regressão logística deve ser bem especificado e que esse problema pode ser particularmente problemático para a regressão logística.
Primeiro, se as probabilidades de log da associação de classe não estiverem linearmente relacionadas aos preditores incluídos no modelo, não serão bem calibrados. O capítulo 10 de Harrell sobre Regressão logística binária dedica cerca de 20 páginas a "Avaliação do ajuste do modelo", para que se possa tirar proveito da "imparcialidade assintótica do estimador de probabilidade máxima", como @whuber colocou na prática.
Segundo, a especificação do modelo é uma questão específica na regressão logística, pois possui um viés de variável omitido inerente que pode surpreender aqueles com experiência em regressão linear comum. Como a página diz:
As variáveis omitidas influenciarão os coeficientes nas variáveis incluídas, mesmo que as variáveis omitidas não estejam correlacionadas com as variáveis incluídas.
Essa página também possui uma explicação útil do motivo pelo qual esse comportamento é esperado, com uma explicação teórica para modelos de probit relacionados, analiticamente tratáveis. Portanto, a menos que você saiba que incluiu todos os preditores relacionados à participação na turma, poderá se deparar com perigos de erros de especificação e má calibração na prática.
Com relação à especificação do modelo, é bem possível que métodos baseados em árvores, como floresta aleatória, que não assumem linearidade em toda uma gama de valores preditores e forneçam inerentemente a possibilidade de encontrar e incluir interações entre preditores, acabem com uma melhor modelo calibrado na prática do que um modelo de regressão logística que não leva suficientemente em consideração os termos de interação ou a não linearidade. Com relação ao viés da variável omitida, não está claro para mim se algum método para avaliar as probabilidades de associação de classe pode lidar adequadamente com esse problema.