Espero que alguém possa ajudar a esclarecer um ponto de confusão para mim. Digamos que eu queira testar se 2 conjuntos de coeficientes de regressão são significativamente diferentes um do outro, com a seguinte configuração:
- , com 5 variáveis independentes.
- 2 grupos, com tamanhos aproximadamente iguais (embora isso possa variar)
- Milhares de regressões semelhantes serão feitas simultaneamente, portanto, algum tipo de correção de múltiplas hipóteses deve ser feita.
Uma abordagem que me foi sugerida é usar um teste Z:
Outro que eu vi sugerido neste quadro é a introdução de uma variável dummy para agrupar e reescrever o modelo como:
, onde g é a variável de agrupamento, codificada como 0, 1.
Minha pergunta é: como essas duas abordagens são diferentes (por exemplo, diferentes suposições feitas, flexibilidade)? Um é mais apropriado que o outro? Eu suspeito que isso seja bastante básico, mas qualquer esclarecimento seria muito apreciado.