@whuber deu uma resposta realmente excelente aqui. Eu só quero adicionar um pequeno ponto complementar. A pergunta afirma que "uma relação linear de preditor e dados não é interpretável". Isso sugere um mal-entendido comum, embora eu normalmente o ouça do outro lado ('qual é a interpretação do termo ao quadrado [cúbico, etc.]?').
Quando temos um modelo com várias covariáveis diferentes , cada termo beta geralmente pode ter sua própria interpretação. Por exemplo, se:
GPAˆcollege=β0+β1GPAhighschool+β2class rank+β3SAT,
(GPA significa média de notas;
classificação é a ordem do GPA de um aluno em relação a outros alunos da mesma escola; &
SAT significa 'teste de aptidão escolar', um teste padrão nacional para estudantes que frequentam a universidade)
então podemos atribuir interpretações separadas para cada beta / termo. Por exemplo, se o GPA do ensino médio de um aluno fosse 1 ponto mais alto - todos os demais sendo iguais - esperaríamos que o GPA da faculdade fosse pontos mais alto. β1
É importante observar, no entanto, que nem sempre é permitido interpretar um modelo dessa maneira. Um caso óbvio é quando há uma interação entre algumas das variáveis, pois não seria possível que o termo individual diferisse e ainda assim tudo se mantivesse constante - por necessidade, o termo de interação também mudaria. Assim, quando há uma interação, não interpretamos efeitos principais, mas apenas efeitos simples , como é bem entendido.
A situação com termos de poder é diretamente análoga, mas infelizmente não parece ser amplamente compreendida. Considere o seguinte modelo:
(Nesta situação, pretende representar uma covariável contínua prototípica.) Não é possível que mude sem mudar também, e vice versa. Simplificando, quando existem termos polinomiais em um modelo, os vários termos baseados na mesma covariável subjacente não recebem interpretações separadas. O termo ( , , etc.) não tem nenhum significado independente. O fato de um
y^=β0+β1x+β2x2
xxx2x2xx17pO termo polinomial de potência é 'significativo' em um modelo indica que há 'dobras' de na função relacionada e . É lamentável, mas inevitável, que quando a curvatura existe, a interpretação se torna mais complicada e possivelmente menos intuitiva. Para avaliar a mudança em medida que muda, teremos que usar cálculo. A derivada do modelo acima é:
que é a taxa instantânea de mudança no valor esperado de conforme muda, sendo o resto igual. Isso não é tão claro quanto a interpretação do modelo mais alto; importante, a taxa instantânea de mudança de
p−1xyy^x
dydx=β1+2β2x
yxy depende do nível de do qual a alteração é avaliadax . Além disso, a taxa de variação em é uma taxa instantânea; isto é, ele próprio muda continuamente ao longo do intervalo de para . Essa é simplesmente a natureza de um relacionamento curvilíneo.
yxoldxnew