Entendo o raciocínio por trás deste conselho, mas i) essa pessoa deveria ter explicado melhor para você e ii) eles também deveriam ter mencionado as suposições restritivas subjacentes a essa idéia.
No teste de Hausman, você geralmente pergunta se existe uma diferença entre um modelo consistente, mas ineficiente, e um modelo potencial inconsistente, que é mais eficiente. No caso padrão em que você compara efeitos fixos e aleatórios, o estimador de efeitos fixos é consistente, independentemente de os efeitos individuais estarem correlacionados com outras variáveis explicativas, mas é menos eficiente que o estimador de efeitos aleatórios, que é consistente apenas para efeitos fixos não correlacionados com o Variáveis explicativas.
Qualquer um dos dois grupos (masculino ou feminino) terá menos observações. A priori, acho que esse é o grupo feminino. Portanto, se você executar a mesma especificação de regressão
que é salário, são as mesmas variáveis de explante de variação de tempo, são os efeitos fixos individuais e é um erro estocástico, então uma diferença entre os modelos masculino e feminino implicaria que existe um tratamento diferente para homens e mulheres em termos de salários. As estatísticas de teste nesse caso seriam
yit=α+X‘itβ+ci+ϵit
yXciϵH=(βfem−βmale)′(Var(βfem)−Var(βmale))(βfem−βmale)
No entanto, e este é um ponto importante, todo esse raciocínio só é verdadeiro se os dois modelos forem especificados corretamente. Deve ser fácil apresentar variáveis omitidas específicas de gênero, que variam de tempo e afetam os salários, por exemplo, nascimento de crianças. Isso imediatamente quebra a suposição principal dessa idéia, para que eu tenha cuidado com isso.