Isso é meio que uma arte, mas há algumas coisas simples e diretas que sempre podemos tentar.
A primeira coisa a fazer é re-expressar a variável dependente ( ) para tornar os resíduos normais. Isso não é realmente aplicável neste exemplo, onde os pontos parecem cair ao longo de uma curva não-linear suave com muito pouca dispersão. Então, prosseguimos para o próximo passo.y
O próximo passo é re-expressar a variável independente ( ) para linearizar o relacionamento. Existe uma maneira simples e fácil de fazer isso. Escolha três pontos representativos ao longo da curva, de preferência nas duas extremidades e no meio. A partir da primeira figura, li os pares ordenados = , e . Sem nenhuma informação que não seja sempre positiva, uma boa opção é explorar as transformações de Box-Cox para vários poderes , geralmente escolhidos como múltiplos de ou e normalmente entre( r , y )r(r,y)( 90 , 0 ) ( 180 , - 2 ) r R → ( r p - 1 ) / p p 1 / 2 1 / 3 - 1 1 p 0 log ( r )(10,7)(90,0)(180,−2)r r→(rp−1)/pp1/21/3−1 e . (O valor limite conforme aproxima de é .) Essa transformação criará uma relação linear aproximada, desde que a inclinação entre os dois primeiros pontos seja igual à inclinação entre o segundo par.1p0log(r)
Por exemplo, as inclinações dos dados não transformados são = - e = . São bem diferentes: um é cerca de quatro vezes o outro. Tentar fornece inclinações de , etc., que funcionam para e : agora um deles é apenas o dobro do outro, o que é uma melhoria. Continuando dessa maneira (uma planilha é conveniente), acho que funciona bem: as inclinações agora são e0,088 ( - 2 - 0 ) / ( 180 - 90 ) - 0,022 p = - 1 / 2 ( 0 - 7 ) / ( 90 - 1 / 2 - 1(0−7)/(90−10)0.088(−2−0)/(180−90)−0.022p=−1/2-16,6-32,4p≈0-7.3-6.6y=α+βlog(R)y(0−7)/(90−1/2−1−1/2−10−1/2−1−1/2)−16.6−32.4p≈0−7.3−6.6, quase o mesmo valor. Conseqüentemente, você deve tentar um modelo com o formato . Em seguida, repita: ajuste uma linha, examine os resíduos, identifique uma transformação de para torná-los aproximadamente simétricos e itere.y=α+βlog(r)y
John Tukey fornece detalhes e muitos exemplos em seu livro clássico Exploratory Data Analysis (Addison-Wesley, 1977). Ele fornece procedimentos semelhantes (mas um pouco mais envolvidos) para identificar transformações estabilizadoras de variação de . Um conjunto de dados de amostra que ele fornece como exercício refere-se a dados seculares sobre as pressões de vapor de mercúrio medidas a várias temperaturas. Seguir este procedimento permite redescobrir a relação Clausius-Clapeyron ; os resíduos do ajuste final podem ser interpretados em termos de efeitos da mecânica quântica que ocorrem a distâncias atômicas!y