Ocasionalmente, vejo na literatura que uma variável categórica, como sexo, é "parcializada" ou "regredida" na análise de regressão (efeitos fixos ou efeitos mistos). Estou preocupado com os seguintes problemas práticos envolvidos nessa declaração:
(1) Geralmente, o método de codificação não é mencionado no artigo. Essa variável deve ser codificada com valores quantitativos, e acho que a maneira sensata deve ser a codificação de efeitos (por exemplo, masculino = 1, feminina = -1), para que a parcialidade possa ser alcançada com outros efeitos interpretados na grande média de ambos os sexos grupos. Uma codificação diferente pode render uma interpretação diferente (e indesejada). Por exemplo, a codificação fictícia (por exemplo, macho = 0, fêmea = 1) deixaria outros efeitos associados aos machos, e não a média geral. Mesmo centralizar essa variável com código fictício pode não funcionar bem para seu objetivo parcial, se houver um número desigual de sujeitos nos dois grupos. Estou correcto?
(2) Se o efeito de uma variável categórica for incluído no modelo, o exame de seus efeitos primeiro parece necessário e deve ser discutido no contexto devido às suas consequências na interpretação de outros efeitos. O que me preocupa é que, às vezes, os autores nem mencionam a importância do efeito sexual, sem falar em qualquer processo de construção de modelo. Se o efeito sexual existe, uma pergunta natural de acompanhamento é se existem interações entre sexo e outras variáveis no modelo? Se nenhum efeito sexual e nenhuma interação existir, o sexo deve ser removido do modelo.
(3) Se o sexo não é considerado interessante para esses autores, qual é o sentido de incluí-lo no modelo em primeiro lugar sem verificar seus efeitos? A inclusão de uma variável tão categórica (e custando um grau de liberdade no efeito fixo do sexo) ganha alguma coisa para seu objetivo parcial quando o efeito sexual existe (minha experiência limitada diz essencialmente não)?