As estatísticas de validação cruzada (CV) e de validação cruzada generalizada (GCV)


23

Encontrei definições possivelmente conflitantes para a estatística de validação cruzada (CV) e para a estatística de validação cruzada generalizada (GCV) associada a um modelo linear (com um vetor de erro normal e homoscedástico \ símbolo de negrito \ varepsilon ).Y=Xβ+εε

Por um lado, Golub, Heath & Wahba definem a estimativa GCV λ^ como (p. 216)

o minimizador de V(λ) fornecido por

V(λ)=1n(IA(λ))y2(1ntr(IA(λ)))2
onde A(λ)=X(XTX+nλI)1XT

Por outro lado, Efron define o mesmo conceito que V(0) (p. 24), mas atribui a introdução desse conceito a Craven & Wahba, onde sua definição (p. 377) é essencialmente a mesma como a definição acima mencionada de Golub, Heath & Wahba.

Isso significa que 0 minimiza V(λ) ?

Da mesma forma, Golub, Heath & Wahba definem a estimativa CV de λ (p. 217) como o minimizador de

P(λ)=1nk=1n([Xβ(k)(λ)]kyk)2

onde β(k)(λ) é a estimativa

β^(λ)=(XTX+nλI)1XTy

de β com o k ésimo ponto de dados yi omitido.

Os autores atribuem a introdução da estimativa CV (também chamada de estimativa PRESS) a Allen ("Allen's PRESS", ibid.) No entanto, no artigo de Allen, a estimativa PRESS é definida (p. 126) como nP(0) (no artigo de Efron, é definido como P(0) (p. 24)).

Novamente, isso significa que 0 minimiza P(λ) ?


  1. Allen, David M. A relação entre seleção de variáveis ​​e documentação de dados e um método para previsão. Technometrics, vol. 16, nº 1 (fevereiro de 1974), pp. 125-127

  2. Craven, Peter e Wahba, Grace. Suavização de dados ruidosos com funções de spline. Numerische Mathematik 31, (1979), pp. 377-403

  3. Efron, Bradley. Quão tendenciosa é a taxa de erro aparente de uma regressão logística? Relatório técnico no. 232. Departamento de Estatística, Universidade de Stanford (abril de 1985)

  4. Golub, Gene H., Heath e Grace Wahba. Validação cruzada generalizada como método para escolher um bom parâmetro de cume. Technometrics, vol. 21, No. 2 (maio de 1979), pp. 215-223


7
Você esqueceu de mencionar que isso será ajustado com regressão de crista e, pelo menos, quadrados? Eu estava totalmente confuso sobre o que foi até que eu vi os títulos de papel na parte inferiorλ
shadowtalker

1
Remova a validação cruzada generalizada no título e adicione regressão de cume no título. Aqui está o padrão do GridSearchCV () para RidgeCV ():
HoofarLotusX

Respostas:


2

Eu acredito que os comentários estão apontando para a resposta, mas não afirmando isso sem rodeios. Então eu vou ser franco.

A fórmula V citada aqui é específica para a regressão linear de crista. Eles não dizem que é o mesmo que o PRESS, dizem que é uma versão do PRESS invariável à rotação. A parte "invariável à rotação" é o que torna isso generalizado.

O artigo de Efron é sobre regressão logística, personalizada para esse contexto. Se você quiser ver a tradução matemática entre os dois contextos, o livro certo para ler é Elements of Statistical Learning, 2ed, de Hastie, Tibshirani e Freedman. Eles oferecem esse livro gratuitamente, on-line: https://web.stanford.edu/~hastie/Papers/ESLII.pdf . Outra leitura útil sobre o GCV é o Generalized Additive Models, de Simon Wood. Seu tratamento integra o GCV em geral com aplicações em regressão e regressão logística.

Se você olhar o livro de ESL, p 244, verá basicamente a mesma simbologia. Eles se referem àquele produto de matriz grande que você tem como matriz mais suave (eu diria que é uma matriz Hat ou primo próximo). Eles descrevem o suave como o mapeamento de paraSyyy^

y^=Sy

S pode ser usado para calcular deixar de fora um valor de CV, um para cada linha nos dados. Para modelos lineares , a matriz desempenha o papel da matriz Hat nos diagnósticos de regressão. No entanto, eles dizem que pode ser um desafio computacional ou desnecessário resolver isso, e a abordagem GCV é uma versão um pouco mais geral da mesma idéia.SS

Eles oferecem uma fórmula para a aproximação do GCV:

GCV(f^)=1NEu=1N[yEu-f^(xEu)1-trumace(S)/N]2

Esse comportamento é bastante semelhante ao da AIC em muitos modelos. O é o número efetivo de parâmetros.trumaceS

O peça você cita é mais geralmente um traço de . Até onde eu entendo, no resumo o GCV é uma versão aproximada de deixar de fora uma validação cruzada, mas em alguns casos (acredito que a regressão de cordilheira) é exata. Esse é um ponto principal no jornal Golub.nλS

Boa sorte, escreva de volta se você aprender mais.


Obrigado. Publiquei minha pergunta há mais de 5 anos e, desde então, esqueci a maior parte deste material, por isso não posso avaliar sua resposta para saber se ela é boa (o que parece ser) ou ruim e, por esse motivo Também não posso aceitar. Obrigado por postar, no entanto. Espero que seja útil para outras pessoas que possam encontrar esta página.
Evan Aad
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.