Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados






1
Bootstrap vs. jackknife
Os métodos bootstrap e jackknife podem ser usados ​​para estimar o viés e o erro padrão de uma estimativa e os mecanismos de ambos os métodos de reamostragem não são muito diferentes: amostragem com substituição vs. deixar de fora uma observação de cada vez. No entanto, o canivete não é …

6
A "classificação média" da Amazon é enganosa?
Se bem entendi, as classificações de livros em uma escala de 1 a 5 são pontuações do Likert. Ou seja, um 3 para mim pode não ser necessariamente um 3 para outra pessoa. É uma IMO em escala ordinal. Não se deve realmente medir escalas ordinais, mas definitivamente pode-se usar …




6
Qual é a melhor maneira de lembrar a diferença entre sensibilidade, especificidade, precisão, exatidão e recall?
Apesar de ter visto esses termos 502847894789 vezes, não consigo me lembrar da diferença entre sensibilidade, especificidade, precisão, exatidão e recordação. Eles são conceitos bastante simples, mas os nomes não são muito intuitivos para mim, então eu os confundi. Qual é uma boa maneira de pensar sobre esses conceitos para …

4
Tempo aleatório de computação na floresta em R
Estou usando o pacote de festa no R com 10.000 linhas e 34 recursos, e alguns recursos de fator têm mais de 300 níveis. O tempo de computação é muito longo. (Demorou 3 horas até agora e ainda não terminou.) Quero saber quais elementos têm um grande efeito no tempo …
49 r  random-forest 




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.