Parece que estou entendendo mal uma afirmação sobre métodos de regressão linear que já vi em vários lugares. Os parâmetros do problema são:
Entrada:
amostras de dados de quantidades cada um consistindo de uma "resposta" quantidade e "predictor" quantidadesy i p x i j
O resultado desejado é um "bom ajuste linear", que prevê a resposta com base nos preditores em que um bom ajuste tem pequenas diferenças entre a previsão e a resposta observada (entre outros critérios).
Saída: coeficientes que é um "bom ajuste" para prever a quantidade de resposta a partir das quantidades do preditor. β j
Estou confuso sobre a abordagem de "regressão de crista" para esse problema. Em "The Elements of Statistical Learning", de Hastie, Tibshirani e Friedman, página 63, a regressão do cume é formulada de duas maneiras.
Primeiro como o problema de otimização restrita :
p ∑ j = 1 β 2 i ≤t
O segundo é o problema de otimização penalizado : para algum parâmetro positivo . λ
O texto diz que estas formulações são equivalentes e que há uma "correspondência um a um entre os parâmetros e ". Eu já vi essa afirmação (e outras similares) em vários lugares além deste livro. Acho que estou perdendo alguma coisa porque não vejo como as formulações são equivalentes como eu a entendo.t
Consideremos o caso em que e com , e , . Escolhendo o parâmetro a formulação restrita se torna:p = 1 y 1 = 0 x 1 , 1 = 0 y 2 = 1 x 1 , 2 = 1 t = 2
expandido para
Para resolver isso, encontre a solução em que as derivadas parciais em relação a e são zero: com a solução e . Observe que conforme necessário.β 1 4 β 0 + 2 β 1 - 2 = 0 2 β 0 + 2 β 1 - 2 = 0 β 0 = 0 β 1 = 1 β 2 0 + β 2 1 ≤ t
Como essa derivação se relaciona com a outra formulação? De acordo com a explicação, existe algum valor de correspondendo exclusivamente a onde, se otimizarmos a formulação penalizada do problema, derivaremos o mesmo e . Nesse caso, o formulário penalizado se torna expandido para Para resolver isso, encontre a solução em que as derivadas parciais com respeito a
Em resumo, estou totalmente confuso com as duas apresentações e não entendo como elas se correspondem. Não entendo como você pode otimizar um formulário e obter a mesma solução para o outro formulário ou como está relacionado a . Essa é apenas uma instância desse tipo de correspondência - existem outras para outras abordagens, como o laço - e não entendo nenhuma delas.
Alguém por favor me ajude.