Por que usar Durbin-Watson em vez de testar a autocorrelação?

10

O teste de Durbin-Watson testa a autocorrelação de resíduos no lag 1. Mas o mesmo acontece com o teste da autocorrelação no lag 1 diretamente. Além disso, você pode testar a autocorrelação em lag 2,3,4 e há bons testes de portmanteau para autocorrelação em vários atrasos e obter gráficos agradáveis e facilmente interpretáveis [por exemplo, a função acf () em R]. Durbin-Watson não é intuitivo de entender e geralmente produz resultados inconclusivos. Então, por que usá-lo?

Isso foi inspirado por essa pergunta sobre a inconclusividade de alguns testes de Durbin-Watson, mas é claramente separado dela.

time-series autocorrelation

— zbicyclist
fonte

11

Você realmente pode fazer Durbin-Watson por outros atrasos. Consulte as estatísticas generalizadas de Durbin-Watson.

— Brandon Sherman

8

Conforme indicado anteriormente neste e em outros tópicos: (1) O teste de Durbin-Watson não é inconclusivo. Somente os limites sugeridos inicialmente por Durbin e Watson foram porque a distribuição precisa depende da matriz regressora observada. No entanto, isso é fácil o suficiente para abordar em software estatístico / econométrico agora. (2) Existem generalizações do teste de Durbin-Watson para defasagens mais altas. Portanto, nem a inconclusividade nem a limitação de defasagens são argumentos contra o teste de Durbin-Watson.

Em comparação com o teste de Wald da variável dependente defasada, o teste de Durbin-Watson pode ter maior poder em certos modelos. Especificamente, se o modelo contiver tendências determinísticas ou padrões sazonais, pode ser melhor testar a autocorrelação nos resíduos (como faz o teste de Durbin-Watson) em comparação à inclusão da resposta defasada (que ainda não está ajustada para os padrões determinísticos) . Eu incluo uma pequena simulação R abaixo.

Uma desvantagem importante do teste de Durbin-Watson é que ele não deve ser aplicado a modelos que já contêm efeitos autorregressivos. Portanto, não é possível testar a autocorrelação residual restante após capturá-la parcialmente em um modelo autoregressivo. Nesse cenário, o poder do teste de Durbin-Watson pode ser completamente quebrado, enquanto no teste de Breusch-Godfrey, por exemplo, não ocorre. Nosso livro "Econometria aplicada com R" possui um pequeno estudo de simulação que mostra isso no capítulo "Programando sua própria análise", consulte http://eeecon.uibk.ac.at/~zeileis/teaching/AER/ .

No entanto, para um conjunto de dados com tendência e erros autocorrelacionados, o poder do teste de Durbin-Watson é maior do que para o teste de Breusch-Godfrey, porém, e também maior do que para o teste de Wald de efeito autoregressivo. Ilustro isso para um cenário pequeno e simples em R. Retiro 50 observações desse modelo e calculo valores de p para todos os três testes:

pvals <- function()
{
  ## data with trend and autocorrelated error term
  d <- data.frame(
    x = 1:50,
    err = filter(rnorm(50), 0.25, method = "recursive")
  )

  ## response and corresponding lags
  d$y <- 1 + 1 * d$x + d$err
      d$ylag <- c(NA, d$y[-50])

  ## OLS regressions with/without lags
  m <- lm(y ~ x, data = d)
  mlag <- lm(y ~ x + ylag, data = d)

  ## p-value from Durbin-Watson and Breusch-Godfrey tests
  ## and the Wald test of the lag coefficient
  c(
    "DW" = dwtest(m)$p.value,
        "BG" = bgtest(m)$p.value,
    "Coef-Wald" = coeftest(mlag)[3, 4]
  )
}

Em seguida, podemos simular 1000 valores p para todos os três modelos:

set.seed(1)
p <- t(replicate(1000, pvals()))

O teste de Durbin-Watson leva aos menores valores médios de p

colMeans(p)
##        DW        BG Coef-Wald 
## 0.1220556 0.2812628 0.2892220

e o poder mais alto no nível de significância de 5%:

colMeans(p < 0.05)
##        DW        BG Coef-Wald 
##     0.493     0.256     0.248

— Achim Zeileis
fonte

Portanto, outra limitação da estatística DW é que ela não pode ser usada se o modelo já tentar controlar a autocorrelação. Aprecio o fato de que o DW tem mais poder do que Wald ou Breusch-Godfrey (nenhum dos quais eu usei), mas minha comparação usual é com um teste de portmanteau como Ljung-Box e as autocorrelações individuais em comparação com um nulo de 0. Esse é um regime típico na previsão de livros didáticos.

— Zbicyclist

2

Não é realmente outra limitação da IMO, mas a principal limitação. Os outros problemas (computação dos valores-p em vez dos limites e número de defasagens) podem ser tratados. E tenha cuidado com a interpretação do poder: eu disse que neste modelo em particular - tendência determinística com o termo de erro AR (1) - o teste de Durbin-Watson tem um poder maior. Pode não ser o caso em muitas outras configurações. E quanto ao teste de Ljung-Box: Sim, este é o teste clássico para verificar a autocorrelação restante após a montagem de um modelo ARIMA.

— Achim Zeileis 28/05

3

O teste de Durbin-Watson é como você testa a autocorrelação. Plotar um ACF é como fazer um gráfico de QQ para testar a normalidade. Ser capaz de observar um gráfico de QQ para testar a normalidade é útil, mas um teste de Kolmogorov-Smirnov ou Levene complementa o que você vê no gráfico, porque um teste de hipótese de normalidade é mais conclusivo.

Com relação a vários atrasos, você pode usar uma estatística generalizada de Durbin-Watson, executar alguns testes de hipóteses e fazer uma correção de Bonferroni para corrigir vários testes. Você também pode executar um teste de Breusch-Godfrey , que testa a presença de uma correlação de qualquer ordem.

— Brandon Sherman
fonte