R2 compara o ajuste do modelo escolhido com o de uma linha reta horizontal (a hipótese nula). Se o modelo escolhido se encaixar pior que uma linha horizontal, então é negativo. Observe que nem sempre é o quadrado de qualquer coisa, portanto pode ter um valor negativo sem violar nenhuma regra de matemática. é negativo apenas quando o modelo escolhido não segue a tendência dos dados; portanto, se encaixa pior que uma linha horizontal.R2R2R2
Exemplo: ajuste os dados a um modelo de regressão linear restrito para que a interceptação em seja igual a .Y1500
O modelo não faz nenhum sentido, dados esses dados. É claramente o modelo errado, talvez escolhido por acidente.
O ajuste do modelo (uma linha reta restrita a passar pelo ponto (0,1500)) é pior que o ajuste de uma linha horizontal. Portanto, a soma dos quadrados do modelo é maior que a soma dos quadrados da linha horizontal . é calculado como . Quando é maior que , essa equação calcula um valor negativo para .(SSreg)(SStot)R21−SSregSStotSSregSStotR2
Com regressão linear sem restrições, deve ser positivo (ou zero) e igual ao quadrado do coeficiente de correlação, . Um negativo só é possível com regressão linear quando a interceptação ou a inclinação são restringidas, de modo que a linha de "melhor ajuste" (dada a restrição) se encaixe pior que uma linha horizontal. Com a regressão não linear, o pode ser negativo sempre que o modelo de melhor ajuste (dada a equação escolhida e suas restrições, se houver) se ajusta aos dados pior que uma linha horizontal.R2rR2R2
Conclusão: um negativo não é uma impossibilidade matemática ou o sinal de um bug do computador. Significa simplesmente que o modelo escolhido (com suas restrições) se ajusta muito mal aos dados.R2