Li que é benéfico aplicar certas transformações de recursos comuns nos conjuntos de dados antes que eles atinjam os modelos de aprendizado de máquina. Eles são baseados nas distribuições dos recursos do conjunto de dados; por exemplo, aplicar transformações de log a recursos normalmente distribuídos inclinados. Alguns exemplos aqui .
Agora, pelo que entendi, o principal benefício do aprendizado profundo é a "engenharia automática de recursos" (também conhecida como "aprendizado de recursos"). Eu sei que isso inclui combinações de recursos; mas meu palpite diz que também inclui transformações de recursos aprendidas, conforme mencionado acima? Portanto, ao usar redes profundas com hypers bem ajustados, as transformações de recursos podem ser removidas com segurança das responsabilidades humanas - isto é, jogar fora todo esse material de log / square / box-cox?
[Editar] Extra: isso também lida com a "seleção de recursos" (decidindo quais entradas não incluir) para você?