A média de betas de Y ~ X e X ~ Y é válida?

7

Estou interessado na relação entre duas variáveis de série temporal: e . As duas variáveis estão relacionadas entre si, e não está claro pela teoria qual delas causa a outra. $Y$ $X$

Dado isso, não têm boas razões para preferir a regressão linear $Y = \alpha + \beta X$ sobre $X = \kappa + \gamma Y$ .

Claramente, existe alguma relação entre $\beta$ e $\gamma$ , embora eu me lembre de estatísticas suficientes para entender que $\beta = 1/ \gamma$ não é verdadeiro. Ou talvez nem esteja perto? Estou um pouco enevoado.

O problema é decidir o quanto de $X$ deve-se manter contra $Y$ .

Estou pensando em pegar a média de $\beta$ e $1/ \gamma$ e usá-la como a taxa de hedge.

A média de $\beta$ e $1/ \gamma$ um conceito significativo?

E como uma questão secundária (talvez essa deva ser outra publicação), qual é a maneira apropriada de lidar com o fato de que as duas variáveis estão relacionadas entre si - o que significa que realmente não existe uma variável independente e dependente?

regression regression-coefficients

— Ricardo
fonte

11

O problema não é causalidade, mas os erros de medição (geralmente é a variável dependente Y que possui um grande erro de medição, tornando "Y = a + B x + error" a expressão comum). Você tem uma idéia sobre os erros na medição de X e Y.

— Sextus Empiricus

11

Os valores exatos de e podem ser encontrados nesta resposta para Efeito de alternar respostas e variáveis explicativas ... e, como você suspeita, não é o recíproco de , e calcula a média de e não é o caminho certo a seguir. Uma visão pictórica do que e estão minimizando é dada na resposta de Elvis à mesma pergunta, e ele introduz uma regressão de "menos retângulos" que você pode querer .....

β

$\beta$

γ

$\gamma$

β

$\beta$

γ

$\gamma$

β

$\beta$

1 / γ

$1/\gamma$

β

$\beta$

γ

$\gamma$

— Dilip Sarwate

3

Você está no cenário ideal em que a escolha da técnica tem um impacto direto, fisicamente mensurável; você pode simplesmente medir o erro de cobertura fora da amostra para cada estimativa e compará-los. Além disso, o hedge tipicamente ideal é melhor tratado com o uso de um modelo VECM (consulte, por exemplo, Gatarek e Johansen, 2014, Hedge ideal com o modelo autoregressivo vetorial cointegrado ), que não requer a escolha do modelo Y em função de X ou vice-versa .

— 22419 Chris Haug

11

Você pode considerar a média geométrica como uma possibilidade (se ambas forem negativas, você poderá obter a raiz quadrada negativa). Então veja , que deve ser muito parecido com o #

\sqrt{\frac{β}{γ}}

$\sqrt{\dfrac{\beta}{\gamma}}$

\frac{s_{y}}{s_{x}}

$\dfrac{s_y}{s_x}$

— Henry Henry

11

@ricardo Observe que eu especifiquei erro fora da amostra , portanto não o ajuste (dentro da amostra) do modelo. E é perfeitamente possível que a taxa ideal de hedge mude ao longo do tempo (especialmente se o relacionamento não for realmente linear), isso não muda o fato de que descobrir a melhor estratégia de hedge pode ser feito mais diretamente testando o modelo novamente e observando os resultados.

— Chris Haug

11

Para ver a conexão entre as duas representações, escolha um vetor Normal bivariado: com os condicionais e Isso significa que

(\begin{matrix} X_{1 1} \\ X_{2} \end{matrix}) \sim N ((\begin{matrix} μ_{1 1} \\ μ_{2} \end{matrix}), (\begin{matrix} σ_{1 1}^{2} & ρ σ_{1 1} σ_{2} \\ ρ σ_{1 1} σ_{2} & σ_{2}^{2} \end{matrix}))

$\begin{pmatrix} X_1 \\ X_2 \end{pmatrix} \sim \mathcal{N} \left( \begin{pmatrix} \mu_1 \\ \mu_2 \end{pmatrix} , \begin{pmatrix} \sigma^2_1 & \rho \sigma_1 \sigma_2 \\ \rho \sigma_1 \sigma_2 & \sigma^2_2 \end{pmatrix} \right)$

X_{1 1} ∣ X_{2} = x_{2} \sim N (μ_{1 1} + ρ \frac{σ_{1 1}}{σ_{2}} (x_{2} - μ_{2}), (1 1 - ρ^{2}) σ_{1 1}^{2})

$X_1 \mid X_2=x_2 \sim \mathcal{N} \left( \mu_1 + \rho \frac{\sigma_1}{\sigma_2}(x_2 - \mu_2),(1-\rho^2)\sigma^2_1 \right)$

X_{2} ∣ X_{1 1} = x_{1 1} \sim N (μ_{2} + ρ \frac{σ_{2}}{σ_{1 1}} (x_{1 1} - μ_{1 1}), (1 1 - ρ^{2}) σ_{2}^{2})

$X_2 \mid X_1=x_1 \sim \mathcal{N} \left( \mu_2 + \rho \frac{\sigma_2}{\sigma_1}(x_1 - \mu_1),(1-\rho^2)\sigma^2_2 \right)$

X_{1 1} = \underset{α}{\underset{⏟}{(μ_{1 1} - ρ \frac{σ_{1 1}}{σ_{2}} μ_{2})}} + \underset{β}{\underset{⏟}{ρ \frac{σ_{1 1}}{σ_{2}}}} X_{2} + \sqrt{1 1 - ρ^{2}} σ_{1 1} ϵ_{1 1}

$X_1=\underbrace{\left(\mu_1-\rho \frac{\sigma_1}{\sigma_2}\mu_2\right)}_\alpha+\underbrace{\rho \frac{\sigma_1}{\sigma_2}}_\beta X_2+\sqrt{1-\rho^2}\sigma_1\epsilon_1$ e que significa que (a) não é e (b) a conexão entre as duas regressões depende da distribuição conjunta de .

X_{2} = \underset{κ}{\underset{⏟}{(μ_{2} - ρ \frac{σ_{2}}{σ_{1 1}} μ_{1 1})}} + \underset{γ}{\underset{⏟}{ρ \frac{σ_{2}}{σ_{1 1}}}} X_{1 1} + \sqrt{1 1 - ρ^{2}} σ_{2} ϵ_{2}

$X_2=\underbrace{\left(\mu_2-\rho \frac{\sigma_2}{\sigma_1}\mu_1\right)}_\kappa+\underbrace{\rho \frac{\sigma_2}{\sigma_1}}_\gamma X_1+\sqrt{1-\rho^2}\sigma_2\epsilon_2$

γ

$\gamma$

1 / β

$1/\beta$

(X_{1}, X_{2})

$(X_1,X_2)$

— Xi'an
fonte

Como eu decidiria se a média dos dois betas é uma medida melhor do hedge ratio do que um ou outro?

— ricardo

4

Eu não faço ideia.

— Xian

@ricardo Medindo o erro de cobertura fora da amostra em cada estimativa, que é o que você está tentando minimizar.

— Chris Haug

3

Convertido de um comentário .....

Os valores exatos de e podem ser encontrados nesta resposta para Efeito de alternar respostas e variáveis explicativas em regressão linear simples e, como você suspeita, não é o recíproco de e a média de e (ou a média de e ) não é o caminho certo a seguir. Uma visão pictórica do que e estão minimizando é dada na resposta de Elvis $\beta$ $\gamma$ $\beta$ $\gamma$ $\beta$ $\gamma$ $\beta$ $1/\gamma$ $\beta$ $\gamma$ para a mesma pergunta e na resposta, ele introduz uma regressão de "menos retângulos" que pode ser o que você está procurando. Os comentários após a resposta de Elvis não devem ser negligenciados; eles relacionam essa regressão de "mínimos retângulos" a outras técnicas estudadas anteriormente. Em particular, observe que o moderador chl indica que esse método é interessante quando não está claro qual é a variável preditora e qual a variável de resposta.

— Dilip Sarwate
fonte

3

$\beta$ e $\gamma$

Como Xi'an observou em sua resposta, o $\beta$ e $\gamma$ estão relacionados entre si por meio dos meios condicionais $X|Y$ e $Y|X$ (que por sua vez se relacionam com uma única distribuição conjunta), elas não são simétricas no sentido de que $\beta \neq 1/\gamma$ . Este não é o caso se você 'conhecer' a verdadeira $\sigma$ e $\rho$ em vez de usar estimativas. Você tem

β = ρ_{X Y} \frac{σ_{Y}}{σ_{X}}

$\beta = \rho_{XY} \frac{\sigma_Y}{\sigma_X}$ e

γ = ρ_{X Y} \frac{σ_{X}}{σ_{Y}}

$\gamma = \rho_{XY} \frac{\sigma_X}{\sigma_Y}$

ou você poderia dizer

β γ = ρ_{X Y}^{2} \leq 1 1

$\beta \gamma = \rho_{XY}^2 \leq 1$

Veja também regressão linear simples na wikipedia para o cálculo da $\beta$ e $\gamma$ .

É esse termo de correlação que meio que perturba a simetria. Quando o $\beta$ e $\gamma$ seria simplesmente a razão do desvio padrão $\sigma_Y/\sigma_X$ e $\sigma_X/\sigma_Y$ então eles seriam, de fato, inversos. o $\rho_{XY}$ pode-se considerar que o termo modifica isso como uma espécie de regressão à média .

Com correlação perfeita $\rho_{XY} = 1$ então você pode prever completamente $X$ baseado em $Y$ ou vice-versa. As encostas serão iguais $β γ = 1 1$ $\beta \gamma = 1$
Mas com uma correlação menos que perfeita, $\rho_{XY} < 1$ , você não pode fazer essas previsões perfeitas e a média condicional estará um pouco mais próxima da média incondicional, em comparação com uma escala simples de $\sigma_Y/\sigma_X$ ou $\sigma_X/\sigma_Y$ . As inclinações das linhas de regressão serão menos íngremes. As encostas não serão relacionadas, pois são recíprocas e seu produto será menor que um $β γ < 1 1$ $\beta \gamma < 1$

Uma linha de regressão é o método certo?

Você pode se perguntar se essas probabilidades condicionais e linhas de regressão são o que você precisa para determinar suas proporções de $X$ e $Y$ . Não está claro para mim como você deseja usar uma linha de regressão no cálculo de uma proporção ideal.

Abaixo está uma maneira alternativa de calcular a proporção. Este método possui simetria (ou seja, se você alternar X e Y, obterá a mesma proporção).

Alternativa

Digamos, os rendimentos dos títulos $X$ e $Y$ são distribuídos de acordo com uma distribuição normal multivariada $^\dagger$ com correlação $\rho_{XY}$ e desvios-padrão $\sigma_X$ e $\sigma_Y$ então o rendimento de uma cobertura que é a soma de $X$ e $Y$ será distribuído normalmente:

H = α X + (1 - α) Y \sim N (μ_{H}, σ_{H}^{2})

$H = \alpha X + (1-\alpha) Y \sim N(\mu_H,\sigma_H^2)$

estavam $0 \leq \alpha \leq 1$ e com

\begin{array}{rcl} μ_{H} & = & α μ_{X} + (1 - α) μ_{Y} \\ σ_{H}^{2} & = & α^{2} σ_{X}^{2} + (1 - α)^{2} σ_{Y}^{2} + 2 α (1 - α) ρ_{X Y} σ_{X} σ_{Y} \\ = & α^{2} (σ_{X}^{2} + σ_{Y}^{2} - 2 ρ_{X Y} σ_{X} σ_{Y}) + α (- 2 σ_{Y}^{2} + 2 ρ_{X Y} σ_{X} σ_{Y}) + σ_{Y}^{2} \end{array}

$\begin{array}{rcl} \mu_H &=& \alpha \mu_X+(1-\alpha) \mu_Y \\ \sigma_H^2 &=& \alpha^2 \sigma_X^2 + (1-\alpha)^2 \sigma_Y^2 + 2 \alpha (1-\alpha) \rho_{XY} \sigma_X \sigma_Y \\ & =& \alpha^2(\sigma_X^2+\sigma_Y^2 -2 \rho_{XY} \sigma_X\sigma_Y) + \alpha (-2 \sigma_Y^2+2\rho_{XY}\sigma_X\sigma_Y) +\sigma_Y^2 \end{array}$

O máximo da média $\mu_H$ estará em

α = 0 or α = 1

$\alpha = 0 \text{ or } \alpha=1$ ou não existe quando

μ_{X} = μ_{Y}

$\mu_X=\mu_Y$ .

O mínimo da variação $\sigma_H^2$ estará em

α = 1 - \frac{σ_{X}^{2} - ρ_{X Y} σ_{X} σ_{Y}}{σ_{X}^{2} + σ_{Y}^{2} - 2 ρ_{X Y} σ_{X} σ_{Y}} = \frac{σ_{Y}^{2} - ρ_{X Y} σ_{X} σ_{Y}}{σ_{X}^{2} + σ_{Y}^{2} - 2 ρ_{X Y} σ_{X} σ_{Y}}

$\alpha = 1 - \frac{\sigma_X^2 -\rho_{XY}\sigma_X\sigma_Y}{\sigma_X^2 +\sigma_Y^2 -2 \rho_{XY} \sigma_X\sigma_Y} = \frac{\sigma_Y^2-\rho_{XY}\sigma_X\sigma_Y}{\sigma_X^2+\sigma_Y^2 -2 \rho_{XY} \sigma_X\sigma_Y}$

O ideal estará em algum lugar entre esses dois extremos e depende de como você deseja comparar perdas e ganhos

Observe que agora existe uma simetria entre $\alpha$ e $1-\alpha$ . Não importa se você usa o hedge $H=\alpha_1 X+(1-\alpha_1)Y$ ou a cobertura $H=\alpha_2 Y + (1-\alpha_2) X$ . Você obterá as mesmas proporções em termos de $\alpha_1 = 1-\alpha_2$ .

Caso de variação mínima e relação com os componentes principais

No caso de variação mínima (aqui, na verdade, você não precisa assumir uma distribuição normal multivariada), obtém a seguinte taxa de hedge como ideal

\frac{α}{1 1 - α} = \frac{v uma r (Y) - c o v (X, Y)}{v uma r (X) - c o v (X, Y)}

$\frac{\alpha}{1-\alpha} = \frac{var(Y) - cov(X,Y)}{var(X)-cov(X,Y)}$ que pode ser expresso em termos dos coeficientes de regressão

β = c o v (X, Y) / v a r (X)

$\beta = cov(X,Y)/var(X)$ e

γ = c o v (X, Y) / v a r (Y)

$\gamma = cov(X,Y)/var(Y)$ e é o seguinte

\frac{α}{1 1 - α} = \frac{1 1 - β}{1 1 - γ}

$\frac{\alpha}{1-\alpha} = \frac{1-\beta}{1-\gamma}$

Em uma situação com mais de duas variáveis / ações / títulos, você pode generalizar isso para o último componente do princípio (menor valor próprio).

Variantes

Melhorias no modelo podem ser feitas usando distribuições diferentes das normais multivariadas. Também é possível incorporar o tempo em um modelo mais sofisticado para fazer melhores previsões de valores / distribuições futuras para o par $X,Y$ .

^{$\dagger$ Isso é uma simplificação, mas serve para o propósito de explicar como alguém pode e deve executar a análise para encontrar uma proporção ideal sem uma linha de regressão.}

— Sextus Empiricus
fonte

11

Sinto muito, mas como físico, sei muito pouco sobre o idioma (longo, curto, participações etc.) relacionado a ações, títulos e finanças. Se você pudesse transmiti-lo em linguagem mais simples, talvez eu entendesse e trabalhasse com ele. Minha resposta é apenas uma expressão muito simples que desconhece os detalhes e as possibilidades de como expressar hedge e ações, mas mostra o princípio básico de como você pode se livrar do uso de uma linha de regressão (volte aos primeiros princípios, expresse a modelo de lucro que está no centro em vez de usar linhas de regressão cuja relevância não é diretamente clara).

— Sextus Empiricus

Eu acho que entendi. O problema é que 1 / ρ_ {XY} \ ne p_ {XY}

. i n d e e d,

$. indeed,$ p_ {XY} $ frequentemente muda bastante quando tomamos o inverso. Sua alternativa está próxima do caso em que estou pensando, mas quero verificar uma coisa: isso permite participações não-negativas? Adotando sua terminologia, eu teria uma unidade de retenção da ligação X e uma retenção negativa de Y. Diga uma unidade longa da ligação X e curta (digamos) 1,2 unidades da ligação Y ... mas poderia ser 0,2 unidades ou 5 unidades, dependendo da matemática.

— ricardo

long significa que eu ganho 1% em um título se o preço aumentar em ~ 1%; short significa que eu perco ~ 1% em um título se o preço aumentar em ~ 1%. Portanto, a ideia é que eu tenha uma unidade de um vínculo (por isso me beneficio de uma apreciação) e tenha uma certa quantia do outro vínculo (por isso perco uma apreciação).

— ricardo

"O problema é decidir quanto de X se deve manter contra Y." Meu problema com isso é que não há explicação / modelo / expressão sobre como você decide sobre isso. Como você define perdas e ganhos e quanto os valoriza?

— Sextus Empiricus

Existem custos associados a ser curto e longo? Eu imagino que você tenha um determinado valor para investir e isso limita o quanto você pode ser curto / longo nesses títulos. Com base no seu conhecimento anterior, você pode estimar / determinar a distribuição de perdas / ganhos para qualquer combinação nesse limite. Por fim, com base em alguma função que determina como você valoriza perdas e ganhos (isso expressa por que / como você protege), você pode decidir qual combinação escolher.

— Sextus Empiricus

1

Talvez a abordagem da "causalidade de Granger" possa ajudar. Isso ajudaria você a avaliar se X é um bom preditor de Y ou se X é melhor de Y. Em outras palavras, informa se beta ou gama é a coisa a ser levada mais a sério. Além disso, considerando que você está lidando com dados de séries temporais, ele informa quanto do histórico de X conta para a previsão de Y (ou vice-versa).

A Wikipedia dá uma explicação simples: uma série temporal X é atribuída à causa Granger Y, se puder ser mostrada, geralmente através de uma série de testes t e testes F nos valores atrasados de X (e com valores atrasados de Y também incluídos) , que esses valores X fornecem informações estatisticamente significativas sobre valores futuros de Y.

O que você faz é o seguinte:

regredir X (t-1) e Y (t-1) em Y (t)
regressão X (t-1), X (t-2), Y (t-1), Y (t-2) em Y (t)
regressão X (t-1), X (t-2), X (t-3), Y (t-1), Y (t-2), Y (t-3) em Y (t)

Continue por qualquer extensão do histórico que seja razoável. Verifique a significância das estatísticas F para cada regressão. Em seguida, faça o mesmo no sentido inverso (portanto, agora regride os valores passados de X e Y em X (t)) e veja quais regressões têm valores F significativos.

Um exemplo muito simples, com código R, é encontrado aqui . A causalidade de Granger foi criticada por não estabelecer a causalidade (em alguns casos). Mas parece que sua aplicação é realmente sobre "causalidade preditiva", que é exatamente para o que a abordagem de causalidade de Granger se destina.

O ponto é que a abordagem dirá se X prediz Y ou se Y prediz X (para que você não seja mais tentado a artificial e incorretamente - compor os dois coeficientes de regressão) e fornece uma previsão melhor (como você saberá quanto histórico de X e Y você precisa saber para prever Y), o que é útil para fins de hedge, certo?

— Steve G. Jones
fonte

Eu tenho uma forte razão teórica para acreditar que nenhuma delas é realmente uma causa, e que mesmo que alguém se torne uma causa, isso não permanecerá verdadeiro com o tempo. Portanto, não acho que Granger Causailty seja a resposta neste caso. Eu votei a resposta em qualquer caso, pois é útil - esp. o código R.

— ricardo

É por isso que mencionei explicitamente que "a causalidade de Granger foi criticada por não estabelecer a causalidade (em alguns casos)". Parece-me que sua pergunta é mais sobre o estabelecimento de "causalidade preditiva", que é a finalidade da causalidade de Granger. Além disso, a abordagem da Granger usa as informações dos dados de séries temporais, que são um desperdício que você não deve usar se os tiver. Obviamente, você pode (deveria?) Reestimar os efeitos ao longo do tempo. Espero que os efeitos de Granger sejam mais estáveis que os OLS de seção transversal (você pode testar isso com antecedência, usando dados históricos). HTH

— Steve G. Jones

A média de betas de Y ~ X e X ~ Y é válida?

ββ\beta e γγ\gamma

Uma linha de regressão é o método certo?

Alternativa

Caso de variação mínima e relação com os componentes principais

Variantes

$\beta$ e $\gamma$