Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados




2
Correlação entre estimadores OLS para interceptação e inclinação
Em um modelo de regressão simples, y=β0+β1x+ε,y=β0+β1x+ε, y = \beta_0 + \beta_1 x + \varepsilon, os estimadores OLS pβ^OLS0β^0OLS\hat{\beta}_0^{OLS} e ββ^OLS1β^1OLS\hat{\beta}_1^{OLS} estão correlacionados. A fórmula para a correlação entre os dois estimadores é (se a derivou corretamente): Corr(β^OLS0,β^OLS1)=−∑ni=1xin−−√∑ni=1x2i−−−−−−−√.Corr⁡(β^0OLS,β^1OLS)=−∑i=1nxin∑i=1nxi2. \operatorname{Corr}(\hat{\beta}_0^{OLS},\hat{\beta}_1^{OLS}) = \frac{-\sum_{i=1}^{n}x_i}{\sqrt{n} \sqrt{\sum_{i=1}^{n}x_i^2} }. Questões: Qual é a explicação intuitiva para …





5
Como gerar uma matriz de correlação aleatória grande com várias correlações fortes presentes?
Gostaria de gerar uma matriz de correlação aleatório de n x n de tamanho de tal modo que existem algumas correlações moderadamente fortes presente:CC\mathbf Cn×nn×nn \times n matriz quadrada de reais simétrico de tamanho, por exemplo, com n = 100 ;n×nn×nn \times nn=100n=100n=100 positivo-definido, ou seja, com todos os autovalores …


1
"Estimativa da densidade do kernel" é uma convolução do quê?
Estou tentando entender melhor a estimativa da densidade do kernel. Usando a definição da Wikipedia: https://en.wikipedia.org/wiki/Kernel_density_estimation#Definition fh^( x ) = 1n∑ni = 1Kh( x - xEu)= 1n h∑ni = 1K( x - xEuh)fh^(x)=1n∑i=1nKh(x−xi)=1nh∑i=1nK(x−xih) \hat{f_h}(x) = \frac{1}{n}\sum_{i=1}^n K_h (x - x_i) \quad = \frac{1}{nh} \sum_{i=1}^n K\Big(\frac{x-x_i}{h}\Big) Vamos considerar como uma função …

2
Como usar os resultados do R prcomp para previsão?
Eu tenho um data.frame com 800 obs. de 40 variáveis ​​e gostaria de usar a Análise de componentes principais para melhorar os resultados da minha previsão (que até agora está funcionando melhor com a Support Vector Machine em cerca de 15 variáveis ​​escolhidas a dedo). Entendo que um prcomp pode …
25 r  pca 

3
LSA vs. PCA (agrupamento de documentos)
Estou investigando várias técnicas usadas no agrupamento de documentos e gostaria de esclarecer algumas dúvidas sobre o PCA (análise de componentes principais) e LSA (análise semântica latente). Primeira coisa - quais são as diferenças entre eles? Eu sei que no PCA, a decomposição de SVD é aplicada à matriz de …



Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.