Qual é o significado intuitivo de ter uma relação linear entre os logs de duas variáveis?


20

Eu tenho duas variáveis ​​que não mostram muita correlação quando plotadas uma contra a outra, mas uma relação linear muito clara quando plotamos os logs de cada variável novamente.

Então, eu terminaria com um modelo do tipo:

log(Y)=alog(X)+b
, que é ótimo matematicamente, mas não parece ter o valor explicativo de um modelo linear regular.

Como posso interpretar esse modelo?


5
Não tenho nada substancial a acrescentar às respostas existentes, mas um logaritmo no resultado e no preditor é uma elasticidade. As pesquisas por esse termo devem encontrar bons recursos para interpretar esse relacionamento, o que não é muito intuitivo.
Upper_Case-Stop Harming Monica

A interpretação de um modelo de log-log, em que a variável dependente é log (y) e a variável independente é log (x), é: %Δ=β1%Δx .
Bob

3
O link log-log complementar é uma especificação GLM ideal quando o resultado é binário (modelo de risco) e a exposição é cumulativa, como número de parceiros sexuais versus infecção pelo HIV. jstor.org/stable/2532454
AdamO 27/03

2
@ Alexis, você pode ver os pontos pegajosos se sobrepor as curvas. Tente curve(exp(-exp(x)), from=-5, to=5)vs curve(plogis(x), from=-5, to=5). A concavidade acelera. Se o risco de evento de um único encontro foi p , o risco após o segundo evento deve ser 1(1p)2 e assim por diante, essa é uma forma probabilística que o logit não captura. Exposições muito altas distorceriam os resultados da regressão logística de maneira mais dramática (falsamente, de acordo com a regra de probabilidade anterior). Alguma simulação mostraria isso a você.
AdamO 27/03

1
@AdamO Provavelmente, há um trabalho pedagógico a ser escrito incorporando uma simulação que motiva como escolher um link de resultado dicotômico em particular dos três, incluindo situações em que ele faz e não faz diferença.
Alexis

Respostas:


27

Você só precisa tomar exponencial dos dois lados da equação e obterá uma relação potencial, que pode fazer sentido para alguns dados.

log(Y)=alog(X)+b

exp(log(Y))=exp(alog(X)+b)

Y=ebXa

E como é apenas um parâmetro que pode assumir qualquer valor positivo, esse modelo é equivalente a:eb

Y=cXa

Deve-se notar que a expressão do modelo deve incluir o termo de erro, e essa alteração de variáveis ​​tem efeitos interessantes sobre ele:

log(Y)=alog(X)+b+ϵ

Y=ebXaexp(ϵ)

Ou seja, seu modelo com erros aditivos respeitando as condições para OLS (erros normalmente distribuídos com variação constante) é equivalente a um modelo potencial com erros multiplicativos cujo logaritm segue uma distribuição normal com variação constante.


3
O OP pode estar interessado em saber que esta distribuição tem um nome, o log-normal: en.wikipedia.org/wiki/Log-normal_distribution
gardenhead

2
E o efeito da desigualdade de Jensen? Geralmente para g convexo,E[g(X)]g(E[X])
estatísticas

14

Você pode pegar seu modelo calcular o diferencial total; você terminará com algo como: que gera log(Y)=alog(X)+b

1YdY=a1XdX
dYdXXY=a

Por isso, uma interpretação simples do coeficiente será a percentagem de alteração em para uma alteração percentual em . Isto implica além disso que as variáveis crescimentos em uma constante fracção ( ) da taxa de crescimento de .aYXYa XaX


Portanto, se o gráfico log-log for linear, isso implicaria uma taxa de crescimento constante?
Dimitriy V. Masterov 26/03

Na verdade, a taxa de crescimento de será constante se e somente se . a = 0Ya=0
RScrlli 26/03

Com o tempo, a taxa de crescimento em relação ao crescimento em x.
Dimitriy V. Masterov 26/03

reordenar não ajuda, eu removia-o
Aksakal 26/03

1
@ DimitriyV.Masterov Ok, em seguida, uma vez que o é linear em , isso significa que a variável cresce a uma fracção constante da taxa de crescimento de . Há algo errado com a minha resposta, de acordo com você? log ( X ) Y Xlog(Y)log(X)YX
RScrlli 26/03

7

Intuitivamente nos fornece a ordem de magnitude de uma variável, para que possamos ver o relacionamento como as ordens de magnitudes das duas variáveis ​​são linearmente relacionadas. Por exemplo, aumentar o preditor em uma ordem de magnitude pode estar associado a um aumento de três ordens de magnitude da resposta.log

Ao plotar usando um gráfico de log-log , esperamos ver um relacionamento linear. Usando um exemplo desta pergunta , podemos verificar as suposições do modelo linear:

log-log


3
+1 para uma resposta intuitiva a um conceito não intuitivo. No entanto, a imagem que você incluiu viola claramente a variação constante de erros no preditor.
Frans Rodenburg

1
A resposta está certa, mas a atribuição de autoria está errada. A imagem não deve ser atribuída às Imagens do Google, mas, pelo menos, à página da Web em que ela pode ser encontrada, que pode ser encontrada apenas clicando nas imagens do Google.
Pere

@Pere Infelizmente não consigo encontrar a fonte original da imagem (pelo menos usando a pesquisa reversa de imagens)
qwr

Parece que ele veio originalmente de diagramss.us, embora o site esteja fora do ar e a maioria de suas páginas não esteja no arquivo da Web, além da página inicial.
Henry

4

Para reconciliar a resposta do @Rscrill com dados discretos reais, considere

log(Yt)=alog(Xt)+b,log(Yt1)=alog(Xt1)+b

log(Yt)log(Yt1)=a[log(Xt)log(Xt1)]

Mas

log(Yt)log(Yt1)=log(YtYt1)log(Yt1+ΔYtYt1)=log(1+ΔYtYt1)

ΔYtYt1 é a variação percentual de entre os períodos e , ou a taxa de crescimento de , digamos . Quando é menor que , temos que uma aproximação aceitável éYt1tYtgYt0.1

log(1+ΔYtYt1)ΔYtYt1=gYt

Portanto, temos

gYtagXt

que valida em estudos empíricos o tratamento teórico do @Rscrill.


1
Provavelmente é isso que um matemático chamaria de intuitivo :)
Richard Hardy

2

Um relacionamento linear entre os logs é equivalente a uma dependência da lei de potência : Na física, esse comportamento significa que o sistema está livre de escala ou invariável . Por exemplo, se é distância ou tempo, isso significa que a dependência de não pode ser caracterizada por um comprimento ou uma escala de tempo característicos (em oposição a decaimentos exponenciais). Como resultado, um tal sistema apresenta uma dependência de longa duração do em .

YXα
X X Y XXXYX

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.