"Variável dummy" e "variável indicadora" são termos usados com frequência para descrever a participação em uma categoria com codificação 0/1; geralmente 0: não é membro da categoria, 1: membro da categoria.
Em 26/11/2014, uma pesquisa rápida em scholar.google.com (com aspas anexas) revela que "variável dummy" é usada em cerca de 318.000 artigos e "variável indicadora" é usada em cerca de 112.000 artigos. O termo "variável dummy" também tem um significado na matemática não estatística de " variável vinculada ", o que provavelmente está contribuindo para o maior uso da "variável dummy" em artigos indexados.
Minhas perguntas vinculadas topicamente:
- Esses termos são sempre sinônimos (dentro das estatísticas)?
- Algum desses termos é aplicado de forma aceitável a outras formas de codificação categórica (por exemplo , codificação de efeitos , codificação de Helmert, etc. )?
- Que razões estatísticas ou disciplinares existem para preferir um termo ao outro?
sex
.
male
, onde 1 significa verdadeiro (neste caso, masculino) e 0 significa falso (neste caso, feminino). Se eu usar o nome da variável sex
, terei que pesquisar como codifiquei essa variável toda vez que retornar a esse conjunto de dados.
male
com valores1
ou0
. Se houver uma variável categórica com mais de 2 categorias que será expandida para variáveis indicadoras para associação em cada nível, eu usaria "variáveis simuladas" para descrever esse conjunto de variáveis indicadoras.