Alguém pode explicar como calcular o efeito marginal do modelo Probit e Logit em termos leigos?
Eu sou novo em estatística e estou confuso sobre esses dois modelos.
Alguém pode explicar como calcular o efeito marginal do modelo Probit e Logit em termos leigos?
Eu sou novo em estatística e estou confuso sobre esses dois modelos.
Respostas:
Não sabe ao certo como "Layman" é a próxima seção, mas você pode achar útil.
effects
pacote em R pode facilmente produzir tais parcelas de probabilidade prevista no eixo vertical vs X no eixo horizontal. Veja socserv.socsci.mcmaster.ca/jfox/Misc/effects/index.html
Os modelos de logit e probit são normalmente usados para descobrir uma probabilidade de que a variável dependente y seja 0 ou 1 com base em várias variáveis de entrada.
Em inglês: suponha que você esteja tentando prever um valor binário, como se alguém irá ou não desenvolver uma doença cardíaca durante sua vida. Você tem várias variáveis de entrada, como pressão arterial, idade, se é ou não fumante, seu IMC, onde moram etc. etc. Todas essas variáveis podem contribuir de alguma maneira para as chances de alguém desenvolver doença cardíaca.
O efeito marginal de uma única variável de entrada é: se você aumentar essa variável um pouco, como isso afeta a probabilidade de ter uma doença cardíaca? Suponha que a pressão arterial aumente ligeiramente, como isso muda as chances de ter uma doença cardíaca? Ou se você aumentar a idade em um ano?
Alguns desses efeitos também podem ser não lineares: aumentar um pouco o IMC pode ter um efeito muito diferente para alguém que tem um IMC muito saudável do que para alguém que não tem.
Você ainda deseja que seu leigo conheça o cálculo, pois o efeito marginal é a derivada de uma probabilidade ajustada em relação à variável de interesse. Como probabilidade ajustada é a função de link (logit, probit ou qualquer outra coisa) aplicada aos valores ajustados, você precisa da regra da cadeia para calculá-la. Portanto, nos modelos de índice linear (onde os parâmetros entram como algo como X'b), é igual ao tempo estimado dos parâmetros a derivada da função de link. Como a derivada é diferente em valores diferentes dos regressores (ao contrário do caso de um modelo linear), você deve decidir onde avaliar o efeito marginal. Uma escolha natural seria valores médios de todos os regressores. Outra abordagem seria avaliar o efeito de cada observação e, em seguida, média sobre eles. A interpretação difere de acordo.