Perguntas com a marcação «random-forest»

A floresta aleatória é um método de aprendizado de máquina baseado na combinação dos resultados de muitas árvores de decisão.

3
Diferença entre floresta aleatória e árvores extremamente aleatórias
Entendi que Floresta Aleatória e Árvores Extremamente Aleatórias diferem no sentido de que as divisões das árvores na Floresta Aleatória são determinísticas, enquanto que são aleatórias no caso de Árvores Extremamente Aleatórias (para ser mais preciso, a próxima divisão é a melhor divisão entre divisões uniformes aleatórias nas variáveis ​​selecionadas …

1
Manualmente calculado
Sei que essa é uma Rpergunta bastante específica , mas posso estar pensando na variação proporcional explicada, , incorretamente. Aqui vai.R2R2R^2 Estou tentando usar o Rpacote randomForest. Eu tenho alguns dados de treinamento e dados de teste. Quando encaixo um modelo de floresta aleatório, a randomForestfunção permite inserir novos dados …

6
Melhore a classificação com muitas variáveis ​​categóricas
Estou trabalhando em um conjunto de dados com mais de 200.000 amostras e aproximadamente 50 recursos por amostra: 10 variáveis ​​contínuas e as outras ~ 40 são variáveis ​​categóricas (países, idiomas, campos científicos etc.). Para essas variáveis ​​categóricas, você tem, por exemplo, 150 países diferentes, 50 idiomas, 50 campos científicos, …



3
Como interpretar o decréscimo médio na precisão e o decréscimo médio GINI nos modelos de floresta aleatória
Estou tendo alguma dificuldade em entender como interpretar a saída de importância variável do pacote Random Forest. A diminuição média na precisão é geralmente descrita como "a diminuição na precisão do modelo ao permutar os valores em cada recurso". É uma declaração sobre o recurso como um todo ou sobre …


2
As variáveis ​​altamente correlacionadas na floresta aleatória não distorcem a precisão e a seleção de recursos?
No meu entendimento, variáveis ​​altamente correlacionadas não causarão problemas de multicolinearidade no modelo aleatório de floresta (por favor, corrija-me se estiver errado). No entanto, por outro lado, se eu tiver muitas variáveis ​​contendo informações semelhantes, o modelo pesará muito nesse conjunto e não nos outros? Por exemplo, existem dois conjuntos …

2
Importância relativa de um conjunto de preditores na classificação de florestas aleatórias em R
Eu gostaria de determinar a importância relativa de conjuntos de variáveis ​​para um randomForestmodelo de classificação em R. A importancefunção fornece a MeanDecreaseGinimétrica para cada preditor individual - é tão simples quanto resumir isso em cada preditor de um conjunto? Por exemplo: # Assumes df has variables a1, a2, b1, …



3


4
Quando evitar a Random Forest?
Sabe-se que as florestas aleatórias têm um desempenho razoavelmente bom em uma variedade de tarefas e são conhecidas como o homem de couro dos métodos de aprendizagem . Existem tipos de problemas ou condições específicas nas quais se deve evitar o uso de uma floresta aleatória?


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.