Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

3
Independência estatística significa falta de causalidade?
Duas variáveis ​​aleatórias A e B são estatisticamente independentes. Isso significa que no DAG do processo: e, é claro, . Mas isso também significa que não há porta da frente de B para A?(A⊥⊥B)(A⊥⊥B)(A {\perp\!\!\!\perp} B)P(A|B)=P(A)P(A|B)=P(A)P(A|B)=P(A) Porque então devemos obter . Então, se for esse o caso, independência estatística significa …


6
Quando usar simulações?
Portanto, esta é uma pergunta muito simples e estúpida. No entanto, quando eu estava na escola, prestei muito pouca atenção a todo o conceito de simulações em sala de aula e isso me deixou um pouco aterrorizado com esse processo. Você pode explicar o processo de simulação em termos leigos? …
40 simulation 


5
Como derivar a solução de regressão de crista?
Estou tendo alguns problemas com a derivação da solução para regressão de crista. Conheço a solução de regressão sem o termo de regularização: β=(XTX)−1XTy.β=(XTX)−1XTy.\beta = (X^TX)^{-1}X^Ty. Porém, após adicionar o termo L2 à função cost, como é que a solução se tornaλ∥β∥22λ‖β‖22\lambda\|\beta\|_2^2 β=(XTX+λI)−1XTy.β=(XTX+λI)−1XTy.\beta = (X^TX + \lambda I)^{-1}X^Ty.

4
Recordação e precisão na classificação
Eu li algumas definições de recall e precisão, embora isso ocorra sempre no contexto da recuperação de informações. Eu queria saber se alguém poderia explicar isso um pouco mais em um contexto de classificação e talvez ilustrar alguns exemplos. Digamos, por exemplo, que eu tenha um classificador binário que me …

3
Como apresentar os resultados de um laço usando glmnet?
Gostaria de encontrar preditores para uma variável dependente contínua de um conjunto de 30 variáveis ​​independentes. Estou usando a regressão Lasso conforme implementada no pacote glmnet em R. Aqui está um código fictício: # generate a dummy dataset with 30 predictors (10 useful & 20 useless) y=rnorm(100) x1=matrix(rnorm(100*20),100,20) x2=matrix(y+rnorm(100*10),100,10) x=cbind(x1,x2) …








5
Clustering dinâmico de distorção do tempo
Qual seria a abordagem para usar o Dynamic Time Warping (DTW) para executar o agrupamento de séries temporais? Eu li sobre o DTW como uma maneira de encontrar semelhança entre duas séries temporais, enquanto elas poderiam ser alteradas no tempo. Posso usar esse método como uma medida de similaridade para …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.