Como calcular a cobertura de intervalo discreto?
O que eu sei fazer:
Se eu tivesse um modelo contínuo, poderia definir um intervalo de confiança de 95% para cada um dos meus valores previstos e, em seguida, ver com que frequência os valores reais estavam dentro do intervalo de confiança. Eu acho que apenas 88% das vezes meu intervalo de confiança de 95% cobre os valores reais.
O que não sei fazer:
Como faço isso para um modelo discreto, como poisson ou gama-poisson? O que tenho para este modelo é o seguinte, fazendo uma única observação (de mais de 100.000 pretendo gerar :)
Número da observação: (arbitrário)
Valor previsto: 1,5
Probabilidade prevista de 0: 0,222
Probabilidade prevista de 1: 0,333
Probabilidade prevista de 2: 0,251
Probabilidade prevista de 3: 0,126
Probabilidade prevista de 4: 0,048
Probabilidade prevista de 5: 0,014 [e 5 ou mais é 0,019]
... (etc)
Probabilidade prevista de 100 (ou para algum valor irrealista): .000
Valor real (um número inteiro como "4")
Observe que, embora eu tenha fornecido os valores de Poisson acima, no modelo real, um valor previsto de 1,5 pode ter diferentes probabilidades previstas de 0,1, ... 100 através das observações.
Estou confuso com a discrição dos valores. Um "5" está obviamente fora do intervalo de 95%, pois há apenas 0,019 em 5 e acima, que é menor que 0,025. Mas haverá muitos 4's - individualmente, eles estão dentro, mas como eu avalio o número de 4's de maneira mais apropriada?
Por que eu me importo?
Os modelos que estou vendo foram criticados por serem precisos no nível agregado, mas fornecerem previsões individuais ruins. Quero ver quão piores são as más previsões individuais do que os intervalos de confiança inerentemente amplos previstos pelo modelo. Estou esperando que a cobertura empírica seja pior (por exemplo, eu acho que 88% dos valores estão dentro do intervalo de confiança de 95%), mas espero que seja um pouco pior.