Como interpreto um modelo probit no Stata?

13

Não sei como interpretar essa regressão probit que executei no Stata. Os dados estão em aprovação de empréstimo e branco é uma variável fictícia que = 1 se uma pessoa era branca e = 0 se a pessoa não era. Qualquer ajuda sobre como ler isso seria muito apreciada. O que estou procurando principalmente é como encontrar a probabilidade estimada de aprovação de empréstimos para brancos e não brancos. Alguém também pode me ajudar com o texto aqui e como torná-lo normal? Me desculpe, eu não sei como fazer isso.

. probit approve white

Iteration 0:   log likelihood = -740.34659  
Iteration 1:   log likelihood = -701.33221  
Iteration 2:   log likelihood = -700.87747  
Iteration 3:   log likelihood = -700.87744  

Probit regression                                 
Number of obs   =       1989

LR chi2(1)      =      78.94

Prob > chi2     =     0.0000

Log likelihood = -700.87744                       

Pseudo R2       =     0.0533

para a variável branco:

Coef.: .7839465  
Std. Err.: .0867118  
z: 9.04  
P>|z|: 0.000  
95% Conf. Interval: .6139946-.9538985

para a constante:

Coef.: .5469463  
Std. Err.: .075435  
z: 7.25  
P>|z|: 0.000  
95% Conf. Interval: .3990964-.6947962

regression multiple-regression stata

— Kyle
fonte

44

Em geral, você não pode interpretar os coeficientes da saída de uma regressão probit (pelo menos de nenhuma maneira padrão). Você precisa interpretar os efeitos marginais dos regressores, ou seja, quanto a probabilidade (condicional) da variável de resultado muda quando você altera o valor de um regressor, mantendo todos os outros regressores constantes em alguns valores. Isso é diferente do caso de regressão linear em que você está interpretando diretamente os coeficientes estimados. Isso ocorre porque, no caso de regressão linear, os coeficientes de regressão são os efeitos marginais .

Na regressão probit, há uma etapa adicional de computação necessária para obter os efeitos marginais depois de calcular o ajuste da regressão probit.

Modelos de regressão linear e probit

Regressão probit: Lembre-se de que, no modelo probit, você está modelando a probabilidade (condicional) de um resultado "bem-sucedido", ou seja, , que $Y_i=1$
$P [Y_{Eu} = 1 ∣ X_{1 Eu}, ..., X_{K Eu}; β_{0 0}, ..., β_{K}] = Φ (β_{0 0} + \sum_{k = 1}^{K} β_{k} X_{k Eu})$ $\mathbb{P}\left[Y_i=1\mid X_{1i}, \ldots, X_{Ki};\beta_0, \ldots, \beta_K\right] = \Phi(\beta_0 + \sum_{k=1}^K \beta_kX_{ki})$ é a função de distribuição cumulativa da distribuição normal padrão. Este basicamente diz que, à condição das variáveis explicativas, a probabilidade de que a variável de saída, é 1, é uma certa função de uma combinação linear das regressores. $\Phi(\cdot)$ $Y_i$
Regressão linear : compare isso com o modelo de regressão linear, em que

E (Y_{Eu} ∣ X_{1 Eu}, ..., X_{K Eu}; β_{0 0}, ..., β_{K}) = β_{0 0} + \sum_{k = 1}^{K} β_{k} X_{k Eu}

$\mathbb{E}\left(Y_i\mid X_{1i}, \ldots, X_{Ki};\beta_0, \ldots, \beta_K\right) = \beta_0 + \sum_{k=1}^K \beta_kX_{ki}$

Efeitos marginais

À exceção do modelo de regressão linear, os coeficientes raramente têm interpretação direta. Normalmente, estamos interessados nos efeitos ceteris paribus das alterações nos regressores que afetam os recursos da variável resultado. Essa é a noção que os efeitos marginais medem.

Regressão linear : agora eu gostaria de saber quanto a média da variável de resultado se move quando movo um dos regressores

\frac{\partial E (Y_{Eu} ∣ X_{1 Eu}, ..., X_{K Eu}; β_{0 0}, ..., β_{K})}{\partial X_{k Eu}} = β_{k}

$\frac{\partial \mathbb{E}\left(Y_i\mid X_{1i}, \ldots, X_{Ki};\beta_0, \ldots, \beta_K\right)}{\partial X_{ki}} = \beta_k$

$k$

Regressão probit: no entanto, é fácil ver que esse não é o caso da regressão probit

\frac{\partial P [Y_{Eu} = 1 ∣ X_{1 Eu}, ..., X_{K Eu}; β_{0 0}, ..., β_{K}]}{\partial X_{k Eu}} = β_{k} ϕ (β_{0 0} + \sum_{k = 1}^{K} β_{k} X_{k Eu})

$\frac{\partial \mathbb{P}\left[Y_i=1\mid X_{1i}, \ldots, X_{Ki};\beta_0, \ldots, \beta_K\right]}{\partial X_{ki}} = \beta_k\phi(\beta_0 + \sum_{k=1}^K \beta_kX_{ki})$

ϕ (\cdot)

$\phi(\cdot)$

Como você calcula essa quantidade e quais são as opções dos outros regressores que devem inserir essa fórmula? Felizmente, o Stata fornece esse cálculo após uma regressão probit e fornece alguns padrões das escolhas dos outros regressores (não há um acordo universal sobre esses padrões).

Regressores discretos

$X_{ki}$ $\{0,1\}$

\begin{aligned} Δ_{X_{k Eu}} P [Y_{Eu} = 1 ∣ X_{1 Eu}, ..., X_{K Eu}; β_{0 0}, ..., β_{K}] & = β_{k} ϕ (β_{0 0} + \sum_{eu = 1}^{k - 1} β_{eu} X_{eu Eu} + β_{k} + \sum_{eu = k + 1}^{K} β_{eu} X_{eu Eu}) \\ - β_{k} ϕ (β_{0 0} + \sum_{eu = 1}^{k - 1} β_{eu} X_{eu Eu} + \sum_{eu = k + 1}^{K} β_{eu} X_{eu Eu}) \end{aligned}

$\small \begin{align} \Delta_{X_{ki}}\mathbb{P}\left[Y_i=1\mid X_{1i}, \ldots, X_{Ki};\beta_0, \ldots, \beta_K\right]&=\beta_k\phi(\beta_0 + \sum_{l=1}^{k-1} \beta_lX_{li}+\beta_k + \sum_{l=k+1}^K\beta_l X_{li}) \\ &\quad- \beta_k\phi(\beta_0 + \sum_{l=1}^{k-1} \beta_lX_{li}+ \sum_{l=k+1}^K\beta_l X_{li}) \end{align}$

Computando efeitos marginais no Stata

Regressão probit: Aqui está um exemplo de cálculo de efeitos marginais após uma regressão probit no Stata.

webuse union   
probit union age grade not_smsa south##c.year
margins, dydx(*)

Aqui está a saída que você obterá do marginscomando

. margins, dydx(*)

Average marginal effects                          Number of obs   =      26200
Model VCE    : OIM

Expression   : Pr(union), predict()
dy/dx w.r.t. : age grade not_smsa 1.south year

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |    .003442    .000844     4.08   0.000     .0017878    .0050963
       grade |   .0077673   .0010639     7.30   0.000     .0056822    .0098525
    not_smsa |  -.0375788   .0058753    -6.40   0.000    -.0490941   -.0260634
     1.south |  -.1054928   .0050851   -20.75   0.000    -.1154594   -.0955261
        year |  -.0017906   .0009195    -1.95   0.051    -.0035928    .0000115
------------------------------------------------------------------------------
Note: dy/dx for factor levels is the discrete change from the base level.

Isso pode ser interpretado, por exemplo, que a alteração de uma unidade na agevariável aumenta a probabilidade de status da união em 0,003442. Da mesma forma, sendo do sul, diminui a probabilidade de status sindical em 0,1054928

Regressão linear : Como verificação final, podemos confirmar que os efeitos marginais no modelo de regressão linear são os mesmos que os coeficientes de regressão (com uma pequena torção). Executando a regressão a seguir e computando os efeitos marginais após

sysuse auto, clear
regress mpg weight c.weight#c.weight foreign
margins, dydx(*)

apenas devolve os coeficientes de regressão. Observe o fato interessante de que o Stata calcula o efeito marginal líquido de um regressor, incluindo o efeito através dos termos quadráticos, se incluído no modelo.

. margins, dydx(*)

Average marginal effects                          Number of obs   =         74
Model VCE    : OLS

Expression   : Linear prediction, predict()
dy/dx w.r.t. : weight foreign

------------------------------------------------------------------------------
             |            Delta-method
             |      dy/dx   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
      weight |  -.0069641   .0006314   -11.03   0.000    -.0082016   -.0057266
     foreign |    -2.2035   1.059246    -2.08   0.038    -4.279585   -.1274157
------------------------------------------------------------------------------

— tchakravarty
fonte

Δ_{X_{k}}

$\Delta_{X_k}$

P [Y = 1]

$P[Y=1]$

P [Y = 1]

$P[Y=1]$

1

$\beta{age}$

. webuse union

. keep union age grade

. probit union age grade

Iteration 0:   log likelihood =  -13864.23  
Iteration 1:   log likelihood = -13796.359  
Iteration 2:   log likelihood = -13796.336  
Iteration 3:   log likelihood = -13796.336  

Probit regression                               Number of obs     =     26,200
                                                LR chi2(2)        =     135.79
                                                Prob > chi2       =     0.0000
Log likelihood = -13796.336                     Pseudo R2         =     0.0049

------------------------------------------------------------------------------
       union |      Coef.   Std. Err.      z    P>|z|     [95% Conf. Interval]
-------------+----------------------------------------------------------------
         age |   .0051821   .0013471     3.85   0.000     .0025418    .0078224
       grade |   .0373899   .0035814    10.44   0.000     .0303706    .0444092
       _cons |  -1.404697   .0587797   -23.90   0.000    -1.519903   -1.289491
------------------------------------------------------------------------------

Então faça

predict yhat

$\beta{age}*20 + \beta{grade}*12 + \beta{cons}$ normal()

di normal(.0051821*20 + .0373899*12 + -1.404697)
.19700266

$\beta{age}$

— Bryan
fonte