Como se pode selecionar o número adequado de parâmetros para um algoritmo genético modelar um determinado sistema?
Por exemplo, suponha que você queira otimizar a produção de carros e tenha 1.000 medições de eficiência horária em várias tarefas para cada um dos 1.000 funcionários diferentes. Então, você tem 1.000.000 de pontos de dados. É provável que a maioria delas esteja fracamente correlacionada com a eficiência geral de sua fábrica, mas não tão fracamente que você possa dizer que elas são irrelevantes com a confiança estatística. Como você escolhe as entradas do seu GA para não ter mais de 1.000.000 de graus de liberdade, resultando em convergência muito lenta ou nenhuma convergência?
Especificamente, quais são os algoritmos que se pode usar para pré-selecionar ou eliminar seletivamente os recursos?
Uma abordagem que me usei nesse cenário é evoluir a própria seleção de parâmetros, para que eu possa ter pais como {a,b,c}
, {b,d,e,q,x,y,z}
etc. Eu mudaria as crianças para adicionar ou descartar recursos. Isso funciona bem para algumas dezenas de recursos. Mas o problema é que é ineficiente se houver um grande número de graus de liberdade. Nesse caso, você está olhando para 10^n
combinações (no exemplo acima 10^1,000,000
), o que torna crítica a pré-filtragem de recursos para obter qualquer tipo de desempenho útil.