Digamos que eu tenha um modelo de classificação preditiva baseado em uma floresta aleatória (usando o pacote randomForest em R). Eu gostaria de configurá-lo para que os usuários finais possam especificar um item para o qual gerar uma previsão e gerar uma probabilidade de classificação. Até agora, não há problema.
Mas seria útil / interessante poder produzir algo como um gráfico de importância variável, mas para o item específico previsto, não para o conjunto de treinamento. Algo como:
Prevê-se que o item X seja um cão (73% provável),
porque:
Pernas = 4
hálito = mau
Pêlo = curto
Alimento = desagradável
Você entendeu. Existe uma maneira padrão, ou pelo menos justificável, de extrair essas informações de uma floresta aleatória treinada? Em caso afirmativo, alguém tem código que fará isso para o pacote randomForest?
m
preditores um por um e ver como a floresta prevê diferentemente parece um pouco caro. Tem que haver uma maneira melhor.