Grupo 1 :
A complexidade / velocidade do grupo 1. não parece muito difícil de descobrir se algoritmos de força bruta são usados (embora possa haver alternativas mais eficientes, como o algoritmo "trancos e barrancos"). Por exemplo, a seleção completa do subconjunto exigirá que regressões de sejam ajustadas, dado um conjunto de recursos candidatos. Um ajuste OLS de uma regressão linear tem a complexidade de (conforme esta postagem ) em que é o tamanho da amostra. Portanto, a complexidade total da seleção de subconjunto completo de força bruta deve ser .2KKO ( K2n )nO ( 2KK2n )
Grupo 2 :
A complexidade / velocidade do grupo 2. é discutida nas seções 3.8 e 3.9 do livro. Por exemplo, a regressão de crista com uma determinada penalidade tem a mesma complexidade computacional que uma regressão regular. Como λ precisa ser encontrado usando a validação cruzada, a carga computacional aumenta linearmente no número de divisões de dados usadas na validação cruzada (por exemplo, ). Se a grade tiver pontos , a complexidade total da regressão de crista com o ajuste do parâmetro será .
Fala-se bastante sobre o LASSOλλSλeuλO (LSK2n )
no livro, mas não consegui encontrar exatamente o que preciso. No entanto, encontrei na p. 443 de Efron et al. "Regressão menos angular" (2004) que a complexidade do LASSO para um dado é a mesma que a complexidade de um ajuste OLS de regressão linear se o método LARS for usado. Então a complexidade total do LASSO com o ajuste do parâmetro será . (Não li esse documento com atenção, por favor, corrija-me se eu entendi errado.) Rede elástica combina cume e LASSO; os dois têm a mesma complexidade computacional; portanto, a complexidade da rede elástica deve ser que é o tamanho da grade do parâmetro de ajusteλλO (LSK2n )
O (ALSK2n )UMAα que equilibra os pesos da crista versus LASSO.
Grupo 3 :
Eu ainda perca qualquer nota sobre a complexidade / velocidade para o grupo 3. que consiste de componentes principais de regressão (PCR) e mínimos quadrados parciais (PLS).