Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados



10
Qual é a diferença entre "probabilidade" e "probabilidade"?
A página da wikipedia afirma que probabilidade e probabilidade são conceitos distintos. Na linguagem não técnica, "probabilidade" é geralmente sinônimo de "probabilidade", mas no uso estatístico há uma clara distinção de perspectiva: o número que é a probabilidade de alguns resultados observados, dado um conjunto de valores de parâmetros, é ...



20
As duas culturas: estatística versus aprendizado de máquina?
No ano passado, li uma postagem de Brendan O'Connor no blog intitulada "Estatística versus aprendizado de máquina, lute!" que discutiu algumas das diferenças entre os dois campos. Andrew Gelman respondeu favoravelmente a isso : Simon Blomberg: Do pacote da sorte de R: Parafraseando provocativamente, 'aprendizado de máquina é estatística menos ...


5
Como entender as desvantagens do K-means
K-means é um método amplamente utilizado na análise de agrupamentos. No meu entendimento, esse método NÃO requer QUALQUER suposição, ou seja, me forneça um conjunto de dados e um número pré-especificado de clusters, k, e apenas aplico esse algoritmo que minimiza a soma dos erros ao quadrado (SSE), o cluster ...

25
Python como um ambiente de trabalho de estatística
Muitas pessoas usam uma ferramenta principal como o Excel ou outra planilha, SPSS, Stata ou R para suas necessidades estatísticas. Eles podem recorrer a algum pacote específico para necessidades muito especiais, mas muitas coisas podem ser feitas com uma planilha simples ou um pacote geral de estatísticas ou um ambiente ...
355 r  spss  stata  python 




11
Explicando aos leigos por que o bootstrapping funciona
Recentemente, usei o bootstrap para estimar intervalos de confiança para um projeto. Alguém que não conhece muito de estatística recentemente me pediu para explicar por que o bootstrapping funciona, ou seja, por que é que reamostrar a mesma amostra repetidamente para obter bons resultados. Percebi que, embora tenha passado muito ...



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.