Suponha que tenhamos um modelo de regressão logística:
Dada uma amostra aleatória de tamanho , podemos calcular intervalos de confiança para o e intervalos de previsão correspondentes para , dado um determinado valor do vetor preditor. Tudo isso é muito padrão e detalhado, por exemplo, aqui .
Suponha, em vez disso, que eu esteja interessado em um intervalo de previsão para , dado . Obviamente, não faz nenhum sentido computar um intervalo de previsão para uma única realização de , porque só pode assumir os valores 0 e 1, e nenhum valor entre eles. No entanto , se considerarmos realizações de para o mesmo valor fixo de , isso se tornará semelhante (mas não idêntico) à questão de calcular um intervalo de previsão para uma variável aleatória binomial . Esta é basicamente a mesma situação descrita por Glen_b nos comentários a esta resposta. Essa pergunta tem uma resposta, além da trivial "use bootstrap não paramétrico"?