Considere a figura a seguir dos Modelos Lineares de Faraway com R (2005, p. 59).
O primeiro gráfico parece indicar que os resíduos e os valores ajustados não estão correlacionados, pois deveriam estar em um modelo linear homoscedástico com erros normalmente distribuídos. Portanto, as segunda e terceira parcelas, que parecem indicar dependência entre os resíduos e os valores ajustados, sugerem um modelo diferente.
Mas por que o segundo gráfico sugere, como observa Faraway, um modelo linear heterocedástico, enquanto o terceiro gráfico sugere um modelo não linear?
O segundo gráfico parece indicar que o valor absoluto dos resíduos está fortemente correlacionado positivamente com os valores ajustados, enquanto nenhuma tendência é evidente no terceiro gráfico. Portanto, se fosse o caso, teoricamente, em um modelo linear heterocedástico com erros normalmente distribuídos
(onde a expressão à esquerda é a matriz de variância-covariância entre os resíduos e os valores ajustados) isso explicaria por que o segundo e o terceiro gráficos concordam com as interpretações de Faraway.
Mas é este o caso? Se não, de que outra forma as interpretações de Faraway da segunda e terceira parcelas podem ser justificadas? Além disso, por que o terceiro gráfico indica necessariamente não linearidade? Não é possível que seja linear, mas que os erros não sejam normalmente distribuídos, ou então eles sejam normalmente distribuídos, mas não sejam centrados em torno de zero?