Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados



1
Sopa de Letrinhas ANOVA Soup & Regression Equivalents
Posso obter ajuda para concluir esta tentativa (em andamento) de tentar me orientar sobre os equivalentes da ANOVA e REGRESSION? Eu tenho tentado conciliar os conceitos, nomenclatura e sintaxe dessas duas metodologias. Há muitos posts sobre este local sobre a sua semelhança, por exemplo, este ou esta , mas ainda …


2
Compreendendo a análise de componentes independentes
Vi e apreciei a pergunta Compreendendo a análise de componentes principais e agora tenho a mesma pergunta para análise de componentes independentes. Quero dizer, quero fazer uma pergunta abrangente sobre as maneiras intuitivas de entender a ACI? Eu quero entender isso. Eu quero entender o propósito disso. Eu quero ter …
18 intuition  ica 


1
Prova da fórmula LOOCV
De Uma Introdução à Aprendizagem Estatística de James et al., A estimativa de validação cruzada de saída única (LOOCV) é definida por que .cv( N )= 1n∑i = 1nMSEEucv(n)=1n∑Eu=1nMSEEu\text{CV}_{(n)} = \dfrac{1}{n}\sum\limits_{i=1}^{n}\text{MSE}_iMSEEu= ( yEu- y^Eu)2MSEEu=(yEu-y^Eu)2\text{MSE}_i = (y_i-\hat{y}_i)^2 Sem prova, a equação (5.2) afirma que, para mínimos quadrados ou regressão polinomial (se …

1
Interpretação do teste de mergulho de Hartigans
Gostaria de encontrar uma maneira de quantificar a intensidade da bimodalidade de algumas distribuições que recebi empiricamente. Pelo que li, ainda há algum debate sobre a maneira de quantificar a bimodalidade. Eu escolhi usar o teste de imersão de Hartigans, que parece ser o único disponível em R (artigo original: …
18 r  distributions 

2
Suavização - quando usá-lo e quando não?
Há um post bastante antigo no blog de William Briggs, que analisa as armadilhas de suavizar dados e transportá-los para análise. O argumento principal é: Se, em um momento de insanidade, você suaviza dados de séries temporais e os utiliza como entrada para outras análises, aumenta drasticamente a probabilidade de …

5
Por que usar a teoria dos valores extremos?
Eu venho da Engenharia Civil, na qual usamos a Extreme Value Theory , como a distribuição GEV para prever o valor de certos eventos, como A maior velocidade do vento , ou seja, o valor em que 98,5% da velocidade do vento seria menor. Minha pergunta é por que usar …

1
Posicionando as setas em um biplot PCA
Eu estou olhando para implementar um biplot para análise de componentes principais (PCA) em JavaScript. Minha pergunta é: como determinar as coordenadas das setas da saída da decomposição de vetor singular (SVD) da matriz de dados?você, V, DU,V,DU,V,D Aqui está um exemplo de biplot produzido por R: biplot(prcomp(iris[,1:4])) Tentei procurar …
18 pca  svd  biplot 





Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.