Eu tenho dados com alguns milhares de recursos e desejo fazer a seleção recursiva de recursos (RFE) para remover os não informativos. Eu faço isso com sinal de intercalação e RFE. No entanto, comecei a pensar, se quero obter o melhor ajuste de regressão (floresta aleatória, por exemplo), quando devo executar o ajuste de parâmetros ( mtry
para RF)? Isto é, como eu entendo acento circunflexo trens RF repetidamente em diferentes subconjuntos recurso com uma mtry fixo. Suponho que o ideal mtry
seja encontrado depois que a seleção de recurso for concluída, mas o mtry
valor que o cursor usa influencia o subconjunto de recursos selecionado? Usar sinal de intercalação com baixa mtry
é muito mais rápido, é claro.
Espero que alguém possa me explicar isso.