Estou aprendendo a usar o pacote BTYD que usa o modelo Pareto / NBD para prever quando será esperado que um cliente volte. No entanto, toda a literatura sobre este modelo é cheia de matemática e não parece haver uma explicação simples / conceitual do funcionamento desse modelo. É possível entender o modelo de Pareto / NBD para não-matemáticos? Eu passei por este famoso artigo de Fader . O modelo Pareto / NBD faz as seguintes suposições:
Eu. Enquanto ativo, o número de transações feitas por um cliente em um período de tempo t é distribuído Poisson com a taxa de transação λ.
ii. A heterogeneidade nas taxas de transação entre os clientes segue uma distribuição gama com o parâmetro de forma re parâmetro de escala α.
iii. Cada cliente tem uma "vida útil" não observada de comprimento τ. Este ponto no qual o cliente se torna inativo é distribuído exponencialmente com a taxa de desistência µ.
iv) A heterogeneidade nas taxas de evasão entre os clientes segue uma distribuição gama com os parâmetros de forma e parâmetro de escala β.
v. A taxa de transação λ e a taxa de desistência µ variam independentemente entre os clientes. "
Não compreendo a (intuição por trás) lógica das suposições (ii), (iii) e (iv). Por que apenas essas distribuições, por que não outras?
Também as premissas do modelo BG / NBD são:
i.) Enquanto ativo, o número de transações realizadas por um cliente segue um processo de Poisson com taxa de transação λ. Isso equivale a supor que o tempo entre transações seja distribuído exponencialmente com a taxa de transação λ
ii) A heterogeneidade em λ segue uma distribuição gama
iii) Após qualquer transação, um cliente se torna inativo com probabilidade p. Portanto, o ponto em que o cliente "desistiu" é distribuído pelas transações de acordo com uma distribuição geométrica (deslocada) com pmf
iv) A heterogeneidade em p segue uma distribuição beta
A racionalidade (intuitiva) das suposições (ii), (iii) e (iv) também não é de todo óbvia.
Serei grato por qualquer ajuda. Obrigado.