O principal objetivo da regressão linear é estimar uma diferença média de resultados comparando níveis adjacentes de um regressor. Existem muitos tipos de meios. Estamos mais familiarizados com a média aritmética.
A M( X) = ( X1+ X2+ … + Xn)n
A AM é o que é estimado usando OLS e variáveis não transformadas. A média geométrica é diferente:
G M( X) = ( X1× X2× … × Xn)-----------------√n= exp( A M( log( X) ))
Praticamente uma diferença GM é uma diferença multiplicativa: você paga X% de um prêmio em juros ao assumir um empréstimo, seus níveis de hemoglobina diminuem X% após o início da metformina, a taxa de falha das molas aumenta X% como uma fração da largura. Em todos esses casos, uma diferença média bruta faz menos sentido.
log(y) ~ x
β1Xeβ1
eβ1= 0,40
registro( x ) ≈ 1 - xXexp( 0,05 ) ≈ 1,05Xexp( 0,5 ) = 1,65YX
y ~ log(x, base=2)
xXβ1
Por fim, o log(y) ~ log(x)
simplesmente aplica as duas definições para obter uma diferença multiplicativa comparando grupos que diferem multiplicativamente nos níveis de exposição.