Você pode querer verificar esta referência . O aprendizado do Sci-kit implementa regressão logística aleatória e o método é descrito lá.
Mas, para responder à sua pergunta, os dois métodos diferem amplamente em seus objetivos. A regressão logística é sobre o ajuste de um modelo e RLR é sobre a localização das variáveis que entram no modelo.
A regressão logística de baunilha é um modelo linear generalizado. Para uma resposta binária, postulamos que as chances de log da probabilidade de resposta são uma função linear de vários preditores. Os coeficientes dos preditores são estimados usando a máxima verossimilhança e a inferência sobre os parâmetros é então baseada nas grandes propriedades da amostra do modelo. Para melhores resultados, normalmente assumimos que o modelo é bastante simples e bem compreendido. Sabemos quais variáveis independentes afetam a resposta. Queremos estimar os parâmetros do modelo.
Obviamente, na prática, nem sempre sabemos quais variáveis devem ser incluídas no modelo. Isso é especialmente verdadeiro em situações de aprendizado de máquina nas quais o número de variáveis explicativas em potencial é enorme e seus valores são escassos.
Ao longo dos anos, muitas pessoas tentaram usar as técnicas de ajuste estatístico de modelos para fins de seleção de variáveis (leia-se "característica"). No aumento do nível de confiabilidade:
- Ajuste um grande modelo e elimine variáveis com estatísticas não significativas da Wald. Nem sempre produz o melhor modelo.
- Veja todos os modelos possíveis e escolha o "melhor". Computacionalmente intensivo e não robusto.
- Ajuste o modelo grande com um termo de penalidade L1 (estilo de laço). Variáveis inúteis são descartadas no ajuste. Melhor, mas instável com matrizes esparsas.
- Método de randomização 3. Pegue subconjuntos aleatórios, ajuste um modelo penalizado para cada um e agrupe os resultados. Variáveis que aparecem com frequência são selecionadas. Quando a resposta é binária, isso é regressão logística aleatória. Uma técnica semelhante pode ser obtida com dados contínuos e o modelo linear geral.