Às vezes, ajuda a imaginar o objetivo dessa análise e o que uma empresa pode fazer sem uma. Suponha que a empresa à qual os dados de rotatividade pertencem deseje fazer algo em relação a uma (possivelmente) alta taxa de rotatividade. Eu posso imaginar duas ações possíveis
- Descubra o que está levando as pessoas a sair e consertar isso (falta de assistência médica? Sem espírito de equipe?) Em geral
- Encontre os funcionários que estão pensando em sair e conversar com eles, descobrindo o que os leva a resolver os problemas especificamente para eles.
Então, por que isso importa ?
As tabelas de elevação são principalmente importantes para o segundo caso de uso. Imagine o que uma empresa pode fazer quando decide investir dinheiro conversando com os funcionários 1 a 1, mas não possui um modelo? A única opção é conversar com todos ou com todos em uma amostra aleatória de tamanho fixo. Conversar com todos, apesar do ganho de identificar todos os participantes em potencial, é muito caro. Mas quando apenas uma amostra aleatória é selecionada para conversar, apenas uma fração de todos os participantes em potencial é identificada enquanto ainda gasta muito dinheiro. Nos dois casos, a relação custo-por-licença-prevenção é bastante alta.
Porém, quando existe um bom modelo, a empresa pode decidir falar apenas com os que têm maior probabilidade de sair (aqueles com os melhores resultados de acordo com o modelo), para que sejam identificados mais partidários em potencial, otimizando o custo por - deixar a prevenção .
Veja novamente as duas primeiras tabelas aqui: http://www2.cs.uregina.ca/~dbd/cs831/notes/lift_chart/lift_chart.html . Digamos que "clientes" = "funcionários" e "respondentes positivos" = "participantes em potencial" (veja os dados abaixo).
Se a empresa decidir que só pode gastar dinheiro suficiente para conversar com 10.000 funcionários, identificará
- 20000100000∗ 10000 = 2000
- 600010000∗ 10000 = 6000
que significa
- 60002000= 3
- 10000 * ( 20000 / 100000 )20000= 10000100000= 0,1
O eixo x em ambos os casos mostra a porcentagem de funcionários contatados, neste exemplo específico 10%.
Apêndice
Dados usados para tornar essa pergunta independente da podridão do link.
Taxa geral
Total de funcionários contactados Identificadores
100000 20000
Efetividade do modelo quando os funcionários são contatados em pedaços de 10000
Total de funcionários contactados Identificadores
10000 6000
20000 10000
30000 13000
40000 15800
50000 17000
60000 18000
70000 18800
80000 19400
90000 19800
100000 20000