Estou tentando entender como entender completamente o processo de decisão de um modelo de classificação de árvore de decisão criado com o sklearn. O principal aspecto que estou vendo é uma representação gráfica da árvore e a lista de importâncias de recursos. O que não entendo é como a importância do recurso é determinada no contexto da árvore. Por exemplo, aqui está minha lista de importâncias de recursos:
Classificação de recursos: 1. FeatureA (0,300237)
RecursoB (0,166800)
RecursoC (0,092472)
RecursoD (0,075009)
RecursoE (0,068310)
RecursoF (0,067118)
RecursoG (0,066510)
RecursoH (0,043502)
RecursoI (0,040281)
RecursoJ (0,039006)
RecursoK (0,032618)
RecursoL (0,008136)
RecursoM (0,000000)
No entanto, quando olho para o topo da árvore, fica assim:
De fato, alguns dos recursos classificados como "mais importantes" não aparecem até muito mais abaixo na árvore, e o topo da árvore é o FeatureJ, que é um dos recursos de classificação mais baixa. Minha suposição ingênua seria que as características mais importantes seriam classificadas perto do topo da árvore para ter o maior impacto. Se isso estiver incorreto, o que torna um recurso "importante"?