A população r-quadrado pode ser definida assumindo pontuações fixas ou pontuações aleatórias:
Pontuações fixas: O tamanho da amostra e os valores particulares dos preditores são mantidos fixos. Assim, é a proporção de variância explicada no resultado pela equação de regressão populacional quando os valores do preditor são mantidos constantes.
Pontuações aleatórias: Os valores específicos dos preditores são obtidos de uma distribuição. Assim, refere-se à proporção de variação explicada no resultado na população em que os valores do preditor correspondem à distribuição da população dos preditores.
Eu já perguntei anteriormente se essa distinção faz muita diferença nas estimativas deρ 2 . Eu também perguntei geralmente sobre como calcular uma estimativa imparcial de .
Percebo que à medida que o tamanho da amostra aumenta, a distinção entre pontuação fixa e pontuação aleatória se torna menos importante. No entanto, estou tentando confirmar se ajustado foi projetado para estimar pontuação fixa ou pontuação aleatória .ρ 2
Questões
- O ajustado é projetado para estimar pontuação fixa ou pontuação aleatória ?ρ 2
- Existe uma explicação baseada em princípios de como a fórmula do quadrado r ajustado se relaciona com uma ou outra forma de ?
Antecedentes da minha confusão
Quando leio Yin e Fan (2001, p.206), eles escrevem:
Uma das premissas básicas do modelo de regressão múltipla é que os valores das variáveis independentes são constantes conhecidas e são fixadas pelo pesquisador antes do experimento. Somente a variável dependente pode variar de amostra para amostra. Esse modelo de regressão é chamado de modelo de regressão linear fixo .
No entanto, nas ciências sociais e comportamentais, os valores das variáveis independentes raramente são fixados pelos pesquisadores e também estão sujeitos a erros aleatórios. Portanto, um segundo modelo de regressão para aplicações foi sugerido, no qual as variáveis dependentes e independentes podem variar (Binder, 1959; Park & Dudycha, 1974). Esse modelo é chamado de modelo aleatório (ou modelo de correção). Embora as estimativas de máxima verossimilhança dos coeficientes de regressão obtidos nos modelos aleatório e fixo sejam as mesmas nas premissas de normalidade, suas distribuições são muito diferentes. O modelo aleatório é tão complexo que é necessária mais pesquisa antes de ser aceita no lugar do modelo de regressão linear fixo comumente usado. Portanto, o modelo fixo é geralmente aplicado, mesmo quando as suposições não são cumpridas completamente (Claudy, 1978). Tais aplicações do modelo de regressão fixo com suposições violadas causariam "ajuste excessivo", porque o erro aleatório introduzido a partir dos dados de amostra menos do que perfeitos tende a ser capitalizado no processo. Como resultado, o coeficiente de correlação múltipla da amostra obtido dessa maneira tende a superestimar a verdadeira correlação múltipla da população (Claudy, 1978; Cohen & Cohen, 1983; Cummings, 1982).
Portanto, não fiquei claro se a afirmação acima está dizendo que ajustado compensa o erro introduzido pelo modelo aleatório ou se isso foi apenas uma ressalva no artigo sinalizando a existência do modelo aleatório, mas que o artigo iria foco no modelo fixo.
Referências
- Yin, P., & Fan, X. (2001). Estimando o encolhimento de na regressão múltipla: Uma comparação de diferentes métodos analíticos. The Journal of Experimental Education, 69 (2), 203-224. PDF