Essa área é chamada de microtargeting (se você quiser pesquisar no Google). As campanhas são bastante secretas sobre suas ferramentas e procedimentos; portanto, que eu saiba, não há muito trabalho publicado, exceto Alvo Político de Hal Malchow (2008) ou Green & Gerber (2008). Saia da votação: Como aumentar a participação dos eleitores (o último trata mais com aspectos de ciências sociais, como quais anúncios são eficazes e tal).
Em questões mais técnicas, a literatura é ainda mais escassa, mas veja, por exemplo, Murray & Scime (2010) , o artigo de Análise Política de Imai & Strauss (2011) ( pós-impressão ) ou o recente artigo de Annals of Applied Statistics por Rusch, Lee, Hornik, Jank & Zeileis (2013) ( impressão ). O que todos eles têm em comum é o uso de técnicas de mineração de dados, principalmente baseadas em árvores.
Murray & Scime usam árvores de classificação padrão como CART.
Rusch et al. use árvores de classificação, modelos logísticos e um híbrido de árvores e regressão logística. Eles também usam (entre outras) florestas aleatórias, redes neurais, máquinas de vetores de suporte e árvores de regressão aditiva bayesiana para comparar com seus híbridos de árvores, conforme descrito na réplica do artigo . Suas árvores híbridas tiveram desempenho igual aos outros métodos em seus conjuntos de dados e oferecem maior interpretabilidade (também compartilhamos seu código e dados).
Imai & Strauss é interessante na medida em que apresentam uma estrutura teórica de decisão abrangente para o planejamento ideal de campanhas, não apenas ferramentas para microtargeting como as outras. Portanto, eles estão muito focados em aspectos da pesquisa operacional sobre como tirar o máximo proveito de cada dólar investido na campanha. No aspecto de sua estrutura, em que empregam técnicas estatísticas para microtargeting e estimativa de participação, eles novamente dependem de árvores de classificação.
Portanto, parece haver algum consenso de que o uso de métodos baseados em árvore funcione bem nessa área.