Isso está correto - as florestas aleatórias discretizam variáveis contínuas, pois são baseadas em árvores de decisão, que funcionam através do particionamento binário recursivo. Porém, com dados suficientes e divisões suficientes, uma função de etapa com muitas etapas pequenas pode se aproximar de uma função suave. Portanto, isso não precisa ser um problema. Se você realmente deseja capturar uma resposta suave por um único preditor, calcula o efeito parcial de qualquer variável específica e ajusta uma função suave a ela (isso não afeta o modelo em si, o que reterá esse caractere gradual).
As florestas aleatórias oferecem algumas vantagens sobre as técnicas de regressão padrão para algumas aplicações. Para mencionar apenas três:
- Eles permitem o uso arbitrário de muitos preditores (é possível mais preditores do que pontos de dados)
- Eles podem aproximar formas não lineares complexas sem especificação a priori
- Eles podem capturar interações complexas entre previsões sem especificação a priori .
Quanto a se é uma regressão "verdadeira", isso é um tanto semântico. Afinal, a regressão por partes também é regressão, mas também não é suave. Como é qualquer regressão com um preditor categórico, conforme apontado nos comentários abaixo.