Técnicas de mineração de dados na campanha de Obama


10

Encontrei este artigo sobre a equipe de mineração de dados na campanha de reeleição de Obama. Infelizmente, o artigo é muito confuso sobre o mecanismo real dos algoritmos estatísticos. No entanto, parecia que as técnicas gerais são conhecidas nas ciências sociais e políticas. Como essa não é minha área de especialização, alguém pode me indicar literatura (visão geral) sobre esse tipo de técnica?

Respostas:


16

Essa área é chamada de microtargeting (se você quiser pesquisar no Google). As campanhas são bastante secretas sobre suas ferramentas e procedimentos; portanto, que eu saiba, não há muito trabalho publicado, exceto Alvo Político de Hal Malchow (2008) ou Green & Gerber (2008). Saia da votação: Como aumentar a participação dos eleitores (o último trata mais com aspectos de ciências sociais, como quais anúncios são eficazes e tal).

Em questões mais técnicas, a literatura é ainda mais escassa, mas veja, por exemplo, Murray & Scime (2010) , o artigo de Análise Política de Imai & Strauss (2011) ( pós-impressão ) ou o recente artigo de Annals of Applied Statistics por Rusch, Lee, Hornik, Jank & Zeileis (2013) ( impressão ). O que todos eles têm em comum é o uso de técnicas de mineração de dados, principalmente baseadas em árvores.

Murray & Scime usam árvores de classificação padrão como CART.

Rusch et al. use árvores de classificação, modelos logísticos e um híbrido de árvores e regressão logística. Eles também usam (entre outras) florestas aleatórias, redes neurais, máquinas de vetores de suporte e árvores de regressão aditiva bayesiana para comparar com seus híbridos de árvores, conforme descrito na réplica do artigo . Suas árvores híbridas tiveram desempenho igual aos outros métodos em seus conjuntos de dados e oferecem maior interpretabilidade (também compartilhamos seu código e dados).

Imai & Strauss é interessante na medida em que apresentam uma estrutura teórica de decisão abrangente para o planejamento ideal de campanhas, não apenas ferramentas para microtargeting como as outras. Portanto, eles estão muito focados em aspectos da pesquisa operacional sobre como tirar o máximo proveito de cada dólar investido na campanha. No aspecto de sua estrutura, em que empregam técnicas estatísticas para microtargeting e estimativa de participação, eles novamente dependem de árvores de classificação.

Portanto, parece haver algum consenso de que o uso de métodos baseados em árvore funcione bem nessa área.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.