Por que a embalagem usa amostras de bootstrap?


10

Ensacamento é o processo de criação de N alunos em N amostras de bootstrap diferentes e, em seguida, calcula a média de suas previsões.

Minha pergunta é: por que não usar outro tipo de amostragem? Por que usar amostras de bootstrap?

Respostas:


9

Pergunta interessante. O bootstrap tem boas propriedades de amostragem, em comparação com algumas alternativas como o canivete. A principal desvantagem do bootstrap é que toda iteração precisa trabalhar com uma amostra do tamanho do conjunto de dados original (que pode ser caro em termos de computação), enquanto outras técnicas de amostragem podem funcionar com amostras muito menores.

Este artigo sugere que o corte ingenuamente do tamanho da amostra pode reduzir o desempenho, em relação ao ensacamento baseado em bootstrap, o que seria um motivo para não fazer isso. O artigo também apresenta um novo método para usar amostras menores nas estimativas de ensacamento, evitando esses problemas.

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.