Econometria: a elasticidade é significativa em minha ou em alguma regressão?


13

Há alguns meses estagiei nesta organização; e, como presente de despedida, decidi passar minha última semana, com qualquer folga que tivesse, para investigar os fatores que afetam os salários dos professores. Um problema que tive com os salários dos professores foi que a distribuição para o estado em questão estava distorcida. Eu tive muitas observações que se agarravam à extremidade inferior do espectro salarial. Tentei resolver isso incorporando um Índice de salários comparáveis ​​em minha variável dependente (salário dos professores), mas os resultados encontrados foram completamente desatualizados para o escopo do meu projeto. Em vez disso, decidi registrar minha variável dependente. Isso foi legal porque agora meus salários tinham uma distribuição normal e pareciam perfeitos no histograma. Quando comecei a testar, cheguei ao ponto em que fiquei com uma última variável independente, a declaração de imposto sobre a propriedade. O problema com meus salários normativos também foi aparente nas minhas observações de declaração de imposto sobre a propriedade. Eu tinha uma enorme variação nos números de declaração de imposto sobre a propriedade na extremidade inferior do espectro. Então, eu registrei essa variável também e ela ainda passou no teste de hipótese nula muito bem.

Não tenho certeza se isso está correto, mas comparando a alteração de uma variável registrada com outra variável registrada, dei-me a elasticidade. Supondo que isso esteja correto, minha equação de regressão (algo como LogWages = B0 + B1 (LogPropertyTaxReturns)) mostra a elasticidade entre as duas variáveis. Isso é significativo? Se meu objetivo era ver qual variável mais afetava os salários dos professores em qualquer município do meu estado, é útil mostrar a elasticidade entre as duas variáveis? Queremos elevar os municípios com os salários mais baixos dos professores para aumentar seus padrões de vida, mas temo extrapolar tão longe as observações reais que minha equação de regressão final não tem sentido.

Edit: Um dos meus maiores medos é que eu deveria ter usado um modelo não linear para mostrar o relacionamento. Eu sinto que forçar tanto a variável dependente quanto a independente a cooperar nessa regressão linear é enganoso de alguma forma.


1
É absolutamente significativo. Veja a definição da elasticidade. Basicamente, você tem informações sobre a direção do relacionamento entre Salários e PropertyTaxReturns. Além disso, você tem uma medida estimada desse relacionamento. Como é Log-Log, os salários serão alterados em porcentagens de B1 por alteração de um por cento da declaração de imposto sobre a propriedade. Você pode fazer uma análise de séries temporais para confirmar. Na verdade, apenas representar graficamente os salários e a declaração do imposto sobre a propriedade ao longo do tempo seria suficiente para ver qual é o relacionamento. Isso é uma forma básica que não leva em conta variáveis ocultas e etc.
Koba

@ Koba Obrigado por comentar tão rapidamente. O problema não é que a elasticidade mude ao longo da curva? Meu maior arrependimento é que eu tenha forçado o modelo a ser linear, forçando a elasticidade a ser bastante estável. Pensando bem, poderia ter sido melhor ter um modelo não linear para refletir esse desvio que eu estava falando.
rosenjcb

Não há nada errado em transformar as variáveis ​​usando log, raiz quadrada, recíprocos ou outros métodos. Você não está forçando nada. Você usa as transformações para encontrar o relacionamento linear entre as variáveis. Às vezes é fácil como você usa y = b0 + b1 * x. Outras vezes, as variáveis ​​são linearmente relacionadas de maneira mais complicada, como por exemplo log (y) = b0 + b1 * (1 / x). A última função pode fornecer um bom relacionamento linear, mas é mais difícil de interpretar, portanto, quanto menos transformação você puder usar, melhor.
Koba

A função log-log é bastante simples log (y) = b0 + b1 * log (x). B1 é precisamente a variação percentual em y por variação percentual em x em sua análise de seção transversal. Novamente, se você tiver esses dados por um determinado período de tempo, basta fazer um gráfico para ver o relacionamento.
Koba

Já registrei variáveis ​​antes e fiz outras transformações para meus modelos de regressão. Eu só estava preocupado que a elasticidade dava a pretensão de encontrar. Embora, pensando bem, o modelo fosse linear, apenas tinha o problema de ter variáveis ​​dependentes e independentes com distribuições distorcidas.
Rosenjcb

Respostas:


12

A resposta para a pergunta é sim, é realmente significativa (pelo menos matematicamente falando). Se você estimar a equação linear

W=β0 0+β1PTR,

β1PTRβ1=WPTRβ1PTRW

euog(W)=β0 0+β1euog(PTR),

β1=WPTRPTRW

De um modo geral, as transformações lineares afetam apenas a interpretação dada aos coeficientes, mas a validade da própria regressão (em termos econômicos gerais) é dada pelas premissas do modelo e pelos fenômenos econômicos analisados.


8

Y=αXβemY=emα+βemX

Acho que sua pergunta é se o uso dessa forma funcional faz ou não sentido em seu modelo específico. É difícil dizer. Como em qualquer regressão linear comum, você está assumindo a forma funcional. Você pode pelo menos pensar nisso como uma aproximação linear que faz mais sentido após a transformação do log-log.


7

xαβF

registroyEu=α+βregistroxEu+j=2Sγjχj+λjχjregistroxEu
χjγλ

Observe que, como uma representação da decisão subjacente "verdadeira", todas as transformações que resultam em uma regressão linear estão incorretas. De fato, todos os modelos vão estar errados. A questão é realmente: a estatística que você obteve deste modelo é útil para o seu problema ? Se o seu estudo estiver focado na determinação de um modelo subjacente, esse é um momento que lhe diz algo interessante sobre esse modelo mais profundo? Se você for mais orientado a políticas, uma aproximação com elasticidade constante o aproximará da verdade de que melhorias adicionais são irrelevantes? Ou são perguntas extremamente difíceis de responder como observador externo. Mas se a única alternativa com a qual você está preocupado é a elasticidade variável, o tipo de teste que descrevi acima pode lhe dar alguma tranqüilidade.


4

As outras respostas abordaram os principais problemas. Gostaria de responder à "Edição" feita pelo OP na pergunta:

Edit: Um dos meus maiores medos é que eu deveria ter usado um modelo não linear para mostrar o relacionamento. Eu sinto que forçar tanto a variável dependente quanto a independente a cooperar nessa regressão linear é enganoso de alguma forma.

Tendemos a esquecer que "transformar uma variável" leva a uma nova variável , cujo comportamento pode ser totalmente diferente do "original". O exemplo mais fácil é comparar os gráficos de uma variável e seu quadrado.

Portanto, considerando os logaritmos naturais de suas variáveis, você não examina mais a relação entre elas , mas uma relação entre alguma função delas.
É uma sorte que o conceito matemático de "logaritmo" possa ser vinculado ao conceito de "elasticidade", que descreve uma relação entre as mudanças percentuais, algo que entendemos do ponto de vista econômico e que podemos interpretar e usar significativamente.

Se se pode razoavelmente dizer que as variáveis ​​exibem uma "relação linear nos logaritmos", significa que seus níveis (isto é, as variáveis ​​reais) têm uma relação não linear:

emyuma+bemxyeuma+xb

Então, por que não estimar um modelo não linear?
Em princípio (matemático), não há razão para não. Algumas questões práticas são:

1) Existem muitas formas de relações não lineares, existe apenas uma relação linear (estruturalmente falando). É uma questão de "custos de pesquisa" para a especificação mais adequada.

2) A relação não linear obtida pode não ter uma explicação econômica clara . Por que isso é um problema? Porque não estamos descobrindo "leis da natureza" aqui, inalteradas no tempo e no espaço. Estamos nos aproximando de um fenômeno social. Ter uma aproximação que, além disso, só pode ser apresentada como uma fórmula matemática, sem um raciocínio econômico que a valide e apóie, torna o resultado muito reduzido.

3) A estimativa não linear é menos estável no que diz respeito à mecânica do algoritmo de estimativa.


3

Eu diria que o seu modelo nesse caso não parece significativo se o seu " objetivo era ver qual variável os salários dos professores mais afetados em qualquer município do meu estado ". Você acabou de mostrar qual é a correlação entre (os registros de) salários e declarações de imposto sobre a propriedade. Você deve pelo menos usar uma regressão múltipla.

Claro, você poderia continuar e desenvolver uma estratégia de identificação adequada e completa com as ferramentas metodológicas apropriadas para estimar a intensidade de cada efeito causal e encontrar o maior ... Na realidade, você provavelmente não será capaz fazê-lo, dadas as complexidades de tal tarefa. É apenas um continuum de refinamentos e você está perto do modelo mais grosseiro possível usado para explicar os salários, muito longe do que eu consideraria as aproximações aceitáveis ​​de uma resposta à pergunta implícita em seu objetivo. Você deve tentar contar com a ajuda de um economista.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.