Alguém pode me dizer como fazer modelagem de recência, frequência e valor monetário (RFM) e modelagem de valor para cliente em R?
Além disso, alguém pode me indicar alguma literatura sobre isso?
Alguém pode me dizer como fazer modelagem de recência, frequência e valor monetário (RFM) e modelagem de valor para cliente em R?
Além disso, alguém pode me indicar alguma literatura sobre isso?
Respostas:
Quanto às referências, o Data Mining Using RFM Analysis deve ajudar na terminologia e em outras referências.
Uma das maneiras mais simples (e populares) de modelar a probabilidade de resposta do cliente é usar a regressão logística com RFM como variáveis explicativas (entre outras variáveis disponíveis).
Para modelar o valor monetário, é possível regredir a receita diretamente no RFM (usando um modelo linear simples para iniciantes), o que geralmente é surpreendentemente bom. Modelos mais avançados / não lineares (como Random Forest ou Gradient Boosting Machine) são melhores que modelos lineares na minha experiência.
Outra abordagem popular é criar um modelo um pouco mais complexo para prever o valor monetário com base em dois submodelos: um para probabilidade de resposta (por exemplo, usando regressão logística como uma função do RFM) e outro para receita condicionada à resposta (novamente, pode ser tão simples quanto um modelo linear de RFM). O valor monetário esperado é o produto das duas previsões.
Se houver dados aleatórios de teste / controle disponíveis, as técnicas baseadas em aumento / levantamento líquido são bastante populares para modelar os benefícios incrementais de um tratamento.
Quanto ao valor do ciclo de vida do cliente, consulte Modelando o valor da vida útil do cliente para obter uma revisão e outras referências.
Com relação à modelagem no R, não conheço nenhum pacote "pronto para uso" para esse tipo de modelagem. O R fornece todos os componentes necessários para isso (a menos que você tenha uma quantidade enorme de dados - nesse caso, talvez seja necessário confiar em ferramentas mais escaláveis)
Não tenho certeza se você ainda está trabalhando na modelagem de RFM. Aqui ( pdf ) está um artigo / a vinheta do pacote BTYD em R que pode ser útil para você. O artigo inteiro é baseado em R e tem 3 modelos diferentes para serem vistos. Na página 1, 2.1 Preparação de dados, você pode ver o contexto sobre RFMs.