Existe uma implementação de floresta aleatória R que funciona bem com dados muito esparsos? Eu tenho milhares ou milhões de variáveis de entrada booleanas, mas apenas centenas ou mais serão VERDADEIRAS para qualquer exemplo.
Sou relativamente novo no R e notei que há um pacote 'Matrix' para lidar com dados esparsos, mas o pacote padrão 'randomForest' parece não reconhecer esse tipo de dados. Se isso importa, os dados de entrada serão produzidos fora de R e importados.
Algum conselho? Também posso usar Weka, Mahout ou outros pacotes.