Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

2
Regressão de Poisson para estimar o risco relativo de resultados binários
Sumário breve Por que é mais comum a regressão logística (com odds ratio) ser usada em estudos de coorte com resultados binários, em oposição à regressão de Poisson (com riscos relativos)? fundo Os cursos de estatística e epidemiologia de graduação e pós-graduação, na minha experiência, geralmente ensinam que a regressão …


5
O aprendizado de máquina é menos útil para entender a causalidade e, portanto, menos interessante para as ciências sociais?
Minha compreensão da diferença entre aprendizado de máquina / outras técnicas de previsão estatística versus o tipo de estatística que os cientistas sociais (por exemplo, economistas) usam é que os economistas parecem muito interessados ​​em entender o efeito de uma única ou várias variáveis ​​- tanto em termos de magnitude …


3
Qual é a função objetivo do PCA?
A análise de componentes principais pode usar a decomposição da matriz, mas isso é apenas uma ferramenta para chegar lá. Como você encontraria os principais componentes sem o uso de álgebra matricial? Qual é a função objetivo (objetivo) e quais são as restrições?
42 pca 


5
Como fazer uma série temporal estacionária?
Além de tirar diferenças, quais são as outras técnicas para fazer uma série temporal não estacionária, estacionária? Normalmente, refere-se a uma série como " integrada de ordem p " se puder ser estacionária através de um operador de atraso .( 1 - L )PXt(1−L)PXt(1-L)^P X_t




6
Por que reduzir a amostra?
Suponha que eu queira aprender um classificador que prevê se um email é spam. E suponha que apenas 1% dos e-mails sejam spam. A coisa mais fácil a fazer seria aprender o classificador trivial que diz que nenhum dos emails é spam. Esse classificador nos daria 99% de precisão, mas …



5
Correlações entre variáveis ​​contínuas e categóricas (nominais)
Gostaria de encontrar a correlação entre uma variável contínua (variável dependente) e uma variável categórica (nominal: sexo, variável independente). Os dados contínuos não são normalmente distribuídos. Antes, eu tinha calculado usando o Spearman . No entanto, me disseram que isso não está certo.ρρ\rho Ao pesquisar na internet, descobri que o …

5
Como interpretar pesos de recurso SVM?
Eu estou tentando interpretar os pesos variáveis ​​dados ajustando um SVM linear. (Estou usando o scikit-learn ): from sklearn import svm svm = svm.SVC(kernel='linear') svm.fit(features, labels) svm.coef_ Não consigo encontrar nada na documentação que indique especificamente como esses pesos são calculados ou interpretados. O sinal do peso tem algo a …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.