É possível controlar o custo da classificação incorreta no pacote R randomForest ?
No meu próprio trabalho, os falsos negativos (por exemplo, falta de erro de uma pessoa ter uma doença) são muito mais caros do que os falsos positivos. O pacote rpart permite que o usuário controle os custos de classificação incorreta especificando uma matriz de perda para ponderar classificações incorretas de maneira diferente. Existe algo semelhante para randomForest
? Por exemplo, devo usar a classwt
opção para controlar o critério Gini?
classwt
: Sim, descobri que, na prática, e de acordo com outros usuários, os resultados não são os esperados. (iii)cutoff
: não sou claro sobre como utilizarcutoff
neste caso e gostaria de receber mais conselhos.