Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

3
Qual é a intuição por trás das distribuições gaussianas condicionais?
Suponha que . Em seguida, a distribuição condicional de considerando que é multivariada, normalmente distribuída com média:X 1 X 2 = x 2X ∼ N2( μ , Σ )X∼N2(μ,Σ)\mathbf{X} \sim N_{2}(\mathbf{\mu}, \mathbf{\Sigma})X1X1X_1X2= x2X2=x2X_2 = x_2 E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2)E[P(X1|X2=x2)]=μ1+σ12σ22(x2−μ2) E[P(X_1 | X_2 = x_2)] = \mu_1+\frac{\sigma_{12}}{\sigma_{22}}(x_2-\mu_2) e variância: Var[P(X1|X2=x2)]=σ11−σ212σ22Var[P(X1|X2=x2)]=σ11−σ122σ22{\rm Var}[P(X_1 | X_2 = …

8
Armadilhas na análise de séries temporais
Estou apenas começando o auto-aprendizado na análise de séries temporais. Percebi que existem várias armadilhas potenciais que não são aplicáveis ​​às estatísticas gerais. Então, desenvolvendo O que são pecados estatísticos comuns? , Eu gostaria de perguntar: O que são armadilhas comuns ou pecados estatísticos na análise de séries temporais? Este …

2
Intuição por trás do porquê do paradoxo de Stein se aplicar apenas em dimensões
O exemplo de Stein mostra que a estimativa de máxima verossimilhança de nnn variáveis ​​normalmente distribuídas com médias μ1,…,μnμ1,…,μn\mu_1,\ldots,\mu_n e variâncias 111 é inadmissível (sob uma função de perda quadrada) se n≥3n≥3n\ge 3 . Para uma prova clara, consulte o primeiro capítulo de Inferência em larga escala: Métodos empíricos de …


5
Como calcular o pseudo- partir da regressão logística de R?
O artigo de Christopher Manning sobre regressão logística em R mostra uma regressão logística em R da seguinte maneira: ced.logr <- glm(ced.del ~ cat + follows + factor(class), family=binomial) Alguma saída: > summary(ced.logr) Call: glm(formula = ced.del ~ cat + follows + factor(class), family = binomial("logit")) Deviance Residuals: Min 1Q …








6
Quais são as alternativas de Gradient Descent?
A descida do gradiente tem um problema de ficar preso no mínimo local. Precisamos executar tempos exponenciais de descida de gradiente para encontrar mínimos globais. Alguém pode me falar sobre quaisquer alternativas de descida de gradiente aplicadas no aprendizado de redes neurais, juntamente com seus prós e contras.

3
Interpretação do preditor e / ou resposta transformada em log
Gostaria de saber se faz diferença na interpretação se apenas as variáveis ​​dependentes, dependentes e independentes ou apenas as independentes são transformadas em log. Considere o caso de log(DV) = Intercept + B1*IV + Error Eu posso interpretar o IV como o aumento percentual, mas como isso muda quando eu …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

3
De onde vem o equívoco de que Y deve ser normalmente distribuído?
Fontes aparentemente respeitáveis ​​afirmam que a variável dependente deve ser normalmente distribuída: Pressupostos do modelo: YYY é normalmente distribuído, erros são normalmente distribuídos, ei∼N(0,σ2)ei∼N(0,σ2)e_i \sim N(0,\sigma^2) e independente, e XXX é fixo e a variação constante σ2σ2\sigma^2 . Penn State, STAT 504 Análise de dados discretos Em segundo lugar, a …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.