Nem tenho certeza de que a pergunta faça muito sentido, mas acho que vi alguns títulos de trabalhos em que eles propunham floresta aleatória com efeitos aleatórios. Isso é possível em R?
Nem tenho certeza de que a pergunta faça muito sentido, mas acho que vi alguns títulos de trabalhos em que eles propunham floresta aleatória com efeitos aleatórios. Isso é possível em R?
Respostas:
Eles não são comumente usados juntos e deve-se tomar cuidado antes de combiná-los.
Florestas aleatórias são normalmente usadas como classificadores. O motivo pelo qual você usaria uma floresta aleatória em vez de outro método (por exemplo, agrupamento K-means) é que você pode ter um grande número de dimensões pelas quais deseja classificar. O problema de ter um grande número de dimensões é que, se você quisesse testar todas as combinações de ordens de dimensão, teria um grande número de opções (ela cresce mais rapidamente que o número de dimensões fatorial).
Efeitos aleatórios são normalmente usados em regressão com medidas repetidas da mesma coisa. Eles são comumente usados em modelos de efeitos mistos, nos quais o termo misto se refere a efeitos fixos e aleatórios. Pensa-se que os efeitos fixos representam os parâmetros que você verá novamente (por exemplo, um medicamento ou a idade de uma pessoa). Pensa-se que os efeitos aleatórios representam uma instância de variabilidade em torno de um parâmetro que você não verá novamente (por exemplo, uma pessoa específica).
Existem exemplos de como usá-los juntos quando houver dados em cluster http://dx.doi.org/10.1080/00949655.2012.741599 e http://www2.ims.nus.edu.sg/Programs/014swclass/files/denis.pdf .
Não conheço nenhum pacote R que possa fazer essa análise.
Sim, é possível. Você deve verificar " Árvores RE-EM: uma abordagem de mineração de dados para dados longitudinais e em cluster " e o pacote R associado REEMtree .
Já faz um tempo desde que eu olhei para o jornal. Lembro que os autores ainda não haviam tentado formar conjuntos dessas árvores, mas que nada sugeria que isso não daria certo.
Efeitos Aleatórios Florestas Aleatórias (MERFs) são uma coisa. Como a resposta acima afirma, há algumas ótimas pesquisas sobre eles pelo grupo do Dr. Larocque no HEC Montreal. O artigo está aqui: http://www.tandfonline.com/doi/abs/10.1080/00949655.2012.741599 .
Essencialmente, é uma maneira teoricamente sólida de combinar a modelagem não linear de florestas aleatórias com efeitos aleatórios lineares.
Acabamos de lançar um pacote de código aberto em Python implementando o MERF usando o algoritmo acima no documento.
Escrevemos um post detalhado sobre o pacote e como usá-lo para conjuntos de dados em cluster.