Identificação causal e splines penalizados

Acabei de receber uma rejeição de uma revista de economia. Entre os motivos citados para a rejeição estavam:

os benefícios do uso do método semi-paramétrico não são evidenciados claramente em comparação com técnicas mais simples alternativas, com identificação limpa de relações causais

Certamente é possível que eu pudesse ter feito um trabalho melhor de motivar a metodologia para um grupo de economistas que geralmente se apega ao OLS. Mas eu violei a "identificação limpa"? Por favor, julgue por si mesmo e deixe-me saber o que você pensa:

Minha principal equação de estimativa é é contínuo, e são binários. Eu posso justificadamente supor que O que significa que o coeficiente em é imparcial, condicional às variáveis fictícias no nível individual ("efeitos fixos" na fala da econometria). Quando incluo variável contínua , estou simplesmente olha a heterogeneidade em efeitos de tratamento estimados ao longo de gradientes . Portanto, o efeito causal médio do tratamento

y_{i t} = α_{i} + β_{1} T_{i t} + f (\begin{array}{l} Z_{i t} \\ Z_{i t} \times T_{i t} \\ Z_{i t} \times T_{i t} \times X_{t} \end{array}) + β_{2} X_{t} + ϵ_{i t}

$y_{it} = \alpha_i + \beta_1 T_{it} + f\left(\begin{array}{l}Z_{it}\\ Z_{it} \times T_{it} \\ Z_{it}\times T_{it} \times X_t\end{array} \right) + \beta_2X_t + \epsilon_{it}$

Z

$Z$

X

$X$

T

$T$

E [ϵ | α, T] = 0

$E[\epsilon|\alpha,T] = 0$

T

$T$

Z

$Z$

Z

$Z$

T

$T$ é uma média de para os vários níveis de que observo.

{\hat{β}}_{1} + {\hat{f}}_{Z \times T}

$\hat\beta_1 + \hat f_{Z\times T}$

Z

$Z$

O modelo é etimado por splines quadráticos penalizados (por exemplo: Ruppert et al. 2003). Especificamente:

y = β_{0} + X^{'} β + \sum_{1}^{p} (Z^{p})^{'} γ + \sum_{j = 1}^{# v a r s} \sum_{k = 1}^{# k n o t s_{j}} δ_{j k} ({(Z_{j} - κ_{j k})}^{p} \times (Z_{j} > κ_{j k})) + ϵ

$y = \beta_0 +X'\beta + \displaystyle\sum_{1}^p (Z^{p})'\gamma + \displaystyle\sum_{j=1}^{\#vars} \displaystyle\sum_{k=1}^{\# knots_j}\delta_{jk}\left(\left(Z_j - \kappa_{jk} \right)^p \times \left(Z_j > \kappa_{jk} \right)\right) + \epsilon$

Isso é resolvido por

[\begin{matrix} \hat{β} \\ \hat{γ} \\ \hat{δ} \end{matrix}] = (C^{'} C + λ^{2 p} D)^{- 1} C^{'} y

$\left[\begin{array}{c} \hat\beta\\ \hat\gamma \\ \hat \delta \\ \end{array}\right] = (C'C + \lambda^{2p}D)^{-1}C'y$

onde inclui os termos paramétricos e os termos do nó, e onde a penalidade na crista se aplica apenas aos termos do nó e é escolhido para minimizar o AIC. (Não posso fazer justiça à metodologia - veja Ruppert et al, ou o livro de Simon Wood sobre o GAM). $C$ $\lambda$

Obviamente, eu uso esses semiparamétricos porque não quero impor formas funcionais infundadas aos meus dados. Fazer isso naturalmente influenciaria minhas estimativas tanto quanto impor um ajuste logarítmico em uma função sinusoidal influenciaria minhas estimativas. Mas há algo inerente aos splines penalizados, como os descrevi, que inerentemente tornariam a declaração a seguir falsa?

E [{\hat{β}}_{1}] = β_{1} iff E [ϵ | α, T] = 0

$E[\hat\beta_1] = \beta_1 \text{ iff } E[\epsilon|\alpha,T] = 0$

— generic_user
fonte

Não estou qualificado para responder à sua pergunta final (embora pareça suspeita), mas talvez para abordar as preocupações dos periódicos, você também deva incluir um modelo OLS em seu artigo e mostrar que ele apresenta um desempenho ruim por alguma métrica?

— precisa

Você não violou a "identificação limpa". Não há nada inerente que torne o modelo semi-paramétrico menos capaz de obter uma identificação limpa. De fato, seu modelo abrange um modelo linear.

@generic_user Você já recebeu uma resolução para isso? Se sim, você pode responder sua pergunta? Caso contrário, você poderia fornecer uma definição de identificação limpa? Tenho algumas perspectivas sobre a publicação de análises ajustadas a splines que podem ou não ser pertinentes a este caso.

— Adamo

Tarde da festa, mas acho que você está se preocupando com a coisa errada aqui. Os árbitros estão dizendo que não gostam que você tenha adicionado complexidade sem provar que é útil. Um exemplo que mostra um modo de falha de seus métodos simples úteis ajudaria a motivar a complexidade extra que você está apresentando. Deve ser possível projetar (ou, melhor ainda, encontrar um exemplo do mundo real) de onde as splines são necessárias para identificar adequadamente um relacionamento causal.

— Paul

Se isso foi publicado em algum momento, você pode mencionar o nome do artigo? Parece uma aplicação interessante.

— usεr11852

A "identificação limpa" dos parâmetros de regressão não é um conceito estabelecido. Acredito que o que o revisor quer dizer com isso é que você deve especificar um parâmetro interpretável, testável, de baixa dimensionalidade e para o qual a análise é decentemente acionada para detectar, de modo que uma estimativa imparcial possa ser obtida com uma eficiência relativamente boa.

O desejo de "identificação limpa" não implica que o OLS seja a única ferramenta adequada para o trabalho. O OLS é, no entanto, uma ferramenta teórica e praticamente sólida para especificar e estimar parâmetros sob uma variedade de configurações. O desejo de "identificação limpa" também não exclui a inferência semiparamétrica. Como uma observação, o spline estende um modelo OLS criando (a) representações complexas de covariáveis. A inferência semiparamétrica envolve modelagem flexível para eliminar a influência das estatísticas auxiliares, mas no seu modelo parece que a principal exposição é tratada dessa maneira.

Penso que o revisor levanta duas preocupações fundamentadas. Primeiro é a lógica da penalização. Métodos de regressão penalizados são valiosos para previsão. Eles raramente são usados para inferência. Métodos penalizados, como regressão de crista, são tendenciosos e é difícil descrever ou avaliar o viés. O objetivo de minimizar o AIC é obter as melhores previsões, inferência não válida. A segunda preocupação comprovada é se o spline é mesmo necessário para modelar a exposição principal. É verdade que você diz que um spline é capaz de modelar formas funcionais não lineares complexas. No entanto, um spline simplifica muito pouco. É uma representação complexa de alta dimensão, com pontos de nó e ajustes que podem ser uma fonte de viés do pesquisador e covariáveis que são quase incompreensíveis para qualquer pessoa, exceto estatísticos altamente treinados. Muitas tendências estatisticamente significativas que são modeladas com precisão por splines têm aproximações lineares subjacentes que não são estatisticamente nem praticamente significativas.

Se a forma funcional da exposição principal for especificada incorretamente, é possível usar os erros padrão do Huber White para obter inferência consistente e imparcial para a inclinação dos mínimos quadrados como uma aproximação de primeira ordem a qualquer tendência não linear. As splines podem ser usadas para modelar variáveis de precisão, nas quais você não baseia a inferência, quando há um design complexo para os dados. Isso serve para corresponder e reduzir efetivamente a variabilidade quando houver heterogeneidade complexa nos dados.

Penso que os comentários dos revisores podem ser abordados ajustando um modelo linear para a exposição e conduzindo a inferência com os erros do Huber White Sandwich. Se a inferência concordar principalmente com a inferência de spline, comente o modelo de spline, na medida em que demonstra uma tendência curvilínea entre a exposição e a resposta.

— AdamO
fonte