A distribuição binomial negativa tornou-se um modelo popular para dados de contagem (especificamente o número esperado de leituras de seqüenciamento dentro de uma determinada região do genoma de um determinado experimento) em bioinformática. As explicações variam:
- Alguns o explicam como algo que funciona como a distribuição de Poisson, mas tem um parâmetro adicional, permitindo mais liberdade para modelar a distribuição verdadeira, com uma variação não necessariamente igual à média
- Alguns o explicam como uma mistura ponderada de distribuições de Poisson (com uma distribuição de mistura gama no parâmetro Poisson)
Existe uma maneira de enquadrar essas justificativas com a definição tradicional de uma distribuição binomial negativa como modelagem do número de sucessos dos ensaios de Bernoulli antes de observar um certo número de falhas? Ou devo pensar nisso como uma feliz coincidência que uma mistura ponderada de distribuições de Poisson com uma distribuição de mistura gama tenha a mesma função de massa de probabilidade que o binômio negativo?