Portanto, temos potencial para um aplicativo de aprendizado de máquina que se encaixe perfeitamente no domínio do problema tradicional resolvido pelos classificadores, ou seja, temos um conjunto de atributos que descrevem um item e um "bloco" no qual eles terminam. No entanto, em vez de criar modelos de probabilidades, como Naive Bayes ou classificadores similares, queremos que nossa saída seja um conjunto de regras aproximadamente legíveis por humanos que possam ser revisadas e modificadas por um usuário final.
O aprendizado de regras de associação se parece com a família de algoritmos que resolve esse tipo de problema, mas esses algoritmos parecem focar na identificação de combinações comuns de recursos e não incluem o conceito de um intervalo final para o qual esses recursos podem apontar. Por exemplo, nosso conjunto de dados é mais ou menos assim:
Item A { 4-door, small, steel } => { sedan }
Item B { 2-door, big, steel } => { truck }
Item C { 2-door, small, steel } => { coupe }
Eu só quero as regras que dizem "se é grande e uma porta 2, é um caminhão", não as regras que dizem "se é uma porta 4 também é pequena".
Uma solução alternativa em que posso pensar é simplesmente usar algoritmos de aprendizado de regras de associação e ignorar as regras que não envolvem um depósito final, mas isso parece um pouco invasivo. Perdi alguma família de algoritmos por aí? Ou talvez eu esteja abordando o problema incorretamente para começar?