Sou mais programador do que estatístico, então espero que essa pergunta não seja muito ingênua.
Isso acontece na execução de programas de amostragem em momentos aleatórios. Se eu coletar N = 10 amostras em tempo aleatório do estado do programa, eu poderia ver a função Foo sendo executada em, por exemplo, I = 3 dessas amostras. Estou interessado no que isso me diz sobre a fração de tempo real F que Foo está em execução.
Entendo que sou distribuído binomialmente com F * N médio. Eu também sei que, dado I e N, F segue uma distribuição beta. Na verdade, eu verifiquei por programa a relação entre essas duas distribuições, que é
cdfBeta(I, N-I+1, F) + cdfBinomial(N, F, I-1) = 1
O problema é que não tenho uma sensação intuitiva do relacionamento. Não consigo "imaginar" por que funciona.
Edição: Todas as respostas foram desafiadoras, especialmente @ whuber's, que eu ainda preciso gritar, mas trazer estatísticas de ordem foi muito útil. No entanto, percebi que deveria ter feito uma pergunta mais básica: dados I e N, qual é a distribuição de F? Todo mundo apontou que é Beta, que eu sabia. Finalmente descobri na Wikipedia ( Conjugado anterior ) que parece ser Beta(I+1, N-I+1)
. Depois de explorá-lo com um programa, parece ser a resposta certa. Então, eu gostaria de saber se estou errado. E ainda estou confuso sobre a relação entre os dois cdfs mostrados acima, por que eles somam 1 e se eles têm alguma coisa a ver com o que eu realmente queria saber.