Estou tentando entender melhor a significância estatística, os tamanhos dos efeitos e similares.
Tenho uma percepção (talvez errada) de que mesmo regressores irrelevantes geralmente se tornam estatisticamente significativos em grandes amostras . Por irrelevante, quero dizer que não há explicação no assunto por que o regressor deve estar relacionado à variável dependente. Portanto, a irrelevância neste post é um conceito puro de assunto e não estatístico.
Eu sei que um regressor será estatisticamente significativo, dada uma amostra suficientemente grande, a menos que o efeito populacional seja exatamente zero (como discutido aqui ). Portanto, um regressor irrelevante que parece estatisticamente significativo em uma amostra grande tem um tamanho de efeito diferente de zero na população.
Questões:
- Como é que um regressor irrelevante é estatisticamente significativo?
- Devo procurar uma explicação do assunto (ou seja, tentar negar a irrelevância) ou isso é um fenômeno estatístico?
Esta é uma continuação de um post em que eu estava tentando esclarecer como curar esse efeito. Enquanto isso, aqui estou perguntando por que isso acontece em primeiro lugar.