Note que mtryé o número de variáveis amostradas aleatoriamente como candidatas em cada divisão. E dentre esses candidatos, o melhor é escolhido para realizar a divisão. Assim, a proporção que você mencionou não é completamente satisfeita. Variáveis mais importantes aparecem com mais freqüência e menos importantes - com menos frequência. Portanto, se a variável for realmente muito importante, existe uma grande probabilidade de que ela seja selecionada em uma árvore e você não precise de correção manual. Mas, às vezes (raramente), é necessário forçar a presença de alguma variável (independentemente de sua possível importância) na regressão. Tanto quanto eu sei, a floresta aleatória do pacote R não suporta essa possibilidade. Porém, se essa variável não tiver intercorrelação com outras, você poderá fazer a regressão comum com essa variável como termo único e executar a regressão aleatória da floresta nos resíduos dessa regressão comum. Se você ainda deseja corrigir a possibilidade de escolher variáveis pré-especificadas, a modificação do código fonte com a próxima compilação é sua opção.