Eu tenho uma pergunta com relação à necessidade de usar métodos de seleção de recursos (florestas aleatórias apresentam valor de importância ou métodos de seleção de recursos univariados etc.) antes de executar um algoritmo de aprendizado estatístico.
Sabemos que, para evitar ajustes excessivos, podemos introduzir penalidades de regularização nos vetores de peso.
Portanto, se eu quiser fazer regressão linear, poderia introduzir os parâmetros de regularização de rede L2 ou L1 ou mesmo Elastic. Para obter soluções esparsas, a penalidade de L1 ajuda na seleção de recursos.
Então, ainda é necessário fazer a seleção de recursos antes de executar a regularização L1 na regressão como Lasso ?. Tecnicamente, Lasso está me ajudando a reduzir os recursos pela penalidade de L1; por que a seleção de recursos é necessária antes de executar o algo?
Li um artigo de pesquisa dizendo que fazer o Anova e o SVM oferece melhor desempenho do que usar o SVM sozinho. Agora a pergunta é: SVM inerentemente faz regularização usando a norma L2. A fim de maximizar a margem, está minimizando a norma do vetor de peso. Então, ele está fazendo regularização em sua função objetivo. Então, tecnicamente, algoritmos como o SVM não devem se preocupar com os métodos de seleção de recursos. Mas o relatório ainda diz que fazer a seleção de Recursos Univariados antes que o SVM normal seja mais poderoso.
Alguém com pensamentos?