Estou tentando criar uma abordagem para detectar anúncios de fraude no meu site. Acho que o problema tem muito em comum com a detecção de e-mail de spam (para o qual um classificador bayesiano ingênuo é uma solução comum), pois muitos dos sinais que indicam uma fraude serão encontrados no texto do anúncio.
No entanto, existem outras informações que podem ser bons indicadores de fraude, mas não tenho certeza se / como um classificador Bayes poderia usá-las, porque elas envolvem valores numéricos (com valores nos extremos da faixa suspeitos) do que valores binários simples correspondentes à presença ou ausência de uma palavra no texto.
Por exemplo, muitos anúncios de fraude têm o preço do item definido muito baixo (para atrair muitas visualizações), portanto, gostaria que um preço menor que o normal fosse um forte indicador de que o anúncio pode ser uma fraude.
Bayes ainda é um bom ajuste para minhas necessidades; caso contrário, você poderia recomendar uma abordagem diferente?