Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


8
Cálculo do número ideal de posições em um histograma
Estou interessado em encontrar o melhor método possível para determinar quantas caixas devo usar em um histograma. Meus dados devem variar de 30 a 350 objetos, no máximo, e, em particular, estou tentando aplicar limiar (como o método de Otsu) em que objetos "bons", dos quais eu deveria ter menos …


9
Probabilidade de um único evento futuro na vida real: O que significa quando eles dizem que "Hillary tem 75% de chance de ganhar"?
Como a eleição é um evento único, não é um experimento que pode ser repetido. Então, o que exatamente significa tecnicamente a afirmação "Hillary tem 75% de chance de ganhar" ? Estou buscando uma definição estatisticamente correta, não intuitiva ou conceitual. Sou um fã amador de estatísticas que está tentando …

7
The Book of Why, por Judea Pearl: Por que ele está atacando as estatísticas?
Estou lendo O Livro do Por, da Judea Pearl, e está ficando sob minha pele 1 . Especificamente, parece-me que ele está criticando incondicionalmente as estatísticas "clássicas" , argumentando que as estatísticas nunca são capazes de investigar relações causais, que nunca estão interessadas em relações causais e que as estatísticas …
79 causality 





3
Um exemplo: regressão do LASSO usando glmnet para resultado binário
Estou começando a se envolver com o uso de glmnetcom LASSO Regressão onde meu desfecho de interesse é dicotômica. Criei um pequeno quadro de dados simulado abaixo: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p …
78 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


6
Agrupamento na saída do t-SNE
Eu tenho um aplicativo em que seria útil agrupar um conjunto de dados barulhento antes de procurar efeitos de subgrupos nos clusters. Olhei pela primeira vez para o PCA, mas são necessários ~ 30 componentes para atingir 90% da variabilidade; portanto, agrupar apenas alguns PCs descartará muita informação. Eu tentei …


3
Como produzir um gráfico bonito dos resultados da análise de agrupamentos k-means?
Estou usando R para fazer cluster K-significa. Estou usando 14 variáveis ​​para executar K-means Qual é uma maneira bonita de traçar os resultados dos meios K? Existem implementações existentes? Ter 14 variáveis ​​complica a plotagem dos resultados? Encontrei algo chamado GGcluster que parece legal, mas ainda está em desenvolvimento. Também …

3
Quando R ao quadrado é negativo?
Meu entendimento é que não pode ser negativo, pois é o quadrado de R. No entanto, executei uma regressão linear simples no SPSS com uma única variável independente e uma variável dependente. Minha saída do SPSS me fornece um valor negativo para . Se eu fosse calcular isso manualmente a …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.