Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados







2
Distribuição da distância de Mahalanobis no nível de observação
Se eu tiver uma amostra de amostra normal multivariada X1,…,Xn∼Np(μ,Σ)X1,…,Xn∼Np(μ,Σ)X_1, \ldots, X_n \sim N_p(\mu,\Sigma) e definir d2i(b,A)=(Xi−b)′A−1(Xi−b)di2(b,A)=(Xi−b)′A−1(Xi−b)d_i^2(b,A) = (X_i - b)' A^{-1} (X_i - b) (que é uma distância de Mahalanobis [ao quadrado] de um ponto de amostra ao vetor aaa usando a matriz para ponderação),AAAqual é a distribuição de …


3
Como testar a autocorrelação dos resíduos?
Eu tenho uma matriz com duas colunas que têm muitos preços (750). Na imagem abaixo, plotei os resíduos da seguinte regressão linear: lm(prices[,1] ~ prices[,2]) Olhando para a imagem, parece ser uma autocorrelação muito forte dos resíduos. No entanto, como posso testar se a autocorrelação desses resíduos é forte? Que …

4
Como revisor, posso justificar a solicitação de disponibilização de dados e código, mesmo que a revista não o faça?
Como a ciência deve ser reproduzível, por definição, há um reconhecimento crescente de que dados e código são um componente essencial da reprodutibilidade, conforme discutido na Mesa Redonda de Yale para compartilhamento de dados e código . Ao revisar um manuscrito para um periódico que não requer compartilhamento de dados …

3
Sites para competições de modelagem preditiva
Participo de competições de modelagem preditiva no Kaggle , TunedIt e CrowdAnalytix . Acho que esses sites são uma boa maneira de se exercitar para estatísticas / aprendizado de máquina. Existem outros sites que eu deva conhecer? Como vocês se sentem sobre as competições em que o anfitrião pretende lucrar …





Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.