Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


5
Intuição (geométrica ou outra) de
Considere a identidade elementar da variação: Var(X)===E[(X−E[X])2]...E[X2]−(E[X])2Var(X)=E[(X−E[X])2]=...=E[X2]−(E[X])2 \begin{eqnarray} Var(X) &=& E[(X - E[X])^2]\\ &=& ...\\ &=& E[X^2] - (E[X])^2 \end{eqnarray} É uma simples manipulação algébrica da definição de um momento central em momentos não centrais. Permite manipulação conveniente de em outros contextos. Ele também permite o cálculo da variação por …



1
Realmente realizamos análises de regressão multivariada com * milhão * coeficientes / variáveis ​​independentes?
Estou gastando algum tempo aprendendo aprendizado de máquina (desculpe a recursão :) e não pude deixar de ficar intrigado com a regra geral de escolher Gradient Descent em vez de resolver equações diretas para calcular coeficientes de regressão, no caso de regressão linear multivariada. Regra prática: se o número de …

4
Nas estatísticas, devo assumir que
Estou estudando estatística e sempre encontro fórmulas contendo o loge estou sempre confuso se devo interpretá-lo como o significado padrão da logbase 10, ou seja, se nas estatísticas o símbolo log geralmente é assumido como o logaritmo natural ln. Em particular, estou estudando a estimativa de frequência de Good-Turing como …



1
Método do segundo momento, movimento browniano?
Deixe- BtBtB_t ser um movimento browniano padrão. Seja Ej,nEj,nE_{j, n} denotar o evento {Bt=0 for some j−12n≤t≤j2n},{Bt=0 for some j−12n≤t≤j2n},\left\{B_t = 0 \text{ for some }{{j-1}\over{2^n}} \le t \le {j\over{2^n}}\right\},e deixeKn=∑j=2n+122n1Ej,n,Kn=∑j=2n+122n1Ej,n,K_n = \sum_{j = 2^n + 1}^{2^{2n}} 1_{E_{j,n}},que111indica a função do indicador. Existeρ>0ρ>0\rho > 0tal que paraP{Kn≥ρ2n}≥ρP{Kn≥ρ2n}≥ρ\mathbb{P}\{K_n \ge \rho2^{n}\} \ge …


2
Velocidade, despesas computacionais de PCA, LASSO, rede elástica
Estou tentando comparar a complexidade computacional / velocidade de estimativa de três grupos de métodos para regressão linear, conforme distinguido em Hastie et al. "Elementos da aprendizagem estatística" (2ª ed.), Capítulo 3: Seleção de subconjunto Métodos de encolhimento Métodos usando direções de entrada derivadas (PCR, PLS) A comparação pode ser …

5
Qual é o tamanho do efeito ... e por que é útil?
Eu tenho um histórico de estatística no nível de pós-graduação introdutório (suponha que eu conheça estatística e probabilidade matemática em nível de graduação (por exemplo, Wackerly et al., Probabilidade de Ross) e possua algum conhecimento da teoria da medida). Recentemente, iniciei um trabalho de desenho experimental e relatórios estatísticos em …




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.