Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

7
Algoritmo para monitorar dinamicamente quantis
Eu quero estimar o quantil de alguns dados. Os dados são tão grandes que não podem ser acomodados na memória. E os dados não são estáticos, novos dados continuam chegando. Alguém conhece algum algoritmo para monitorar os quantis dos dados observados até agora com memória e computação muito limitadas? Acho …


13
Livros de econometria?
Quais bons livros didáticos de econometria você recomendaria? Edit: existem alguns livros por aí, com diferentes níveis de sofisticação matemática. Seria bom ter uma idéia de quão técnico é o livro que você está recomendando.




2
Como entender “não linear” como em “redução de dimensionalidade não linear”?
Estou tentando entender as diferenças entre os métodos de redução de dimensionalidade linear (por exemplo, PCA) e os não lineares (por exemplo, Isomap). Não consigo entender direito o que a (não) linearidade implica nesse contexto. Eu li na Wikipedia que Por comparação, se o PCA (um algoritmo de redução de …

2
Como a CNN '12 de Krizhevsky 'obtém 253.440 neurônios na primeira camada?
Em Alex Krizhevsky, et al. Na classificação Imagenet com redes neurais convolucionais profundas, eles enumeram o número de neurônios em cada camada (veja o diagrama abaixo). A entrada da rede é 150.528-dimensional, e o número de neurônios nas camadas restantes da rede é dado por 253.440-186.624-64.896-64.896–43.264– 4096–4096-1000. Uma visualização em …

3
Análise diária de séries temporais
Estou tentando fazer análise de séries temporais e sou novo nesse campo. Eu tenho contagem diária de um evento de 2006-2009 e quero ajustar um modelo de série temporal a ele. Aqui está o progresso que eu fiz: timeSeriesObj = ts(x,start=c(2006,1,1),frequency=365.25) plot.ts(timeSeriesObj) O gráfico resultante que recebo é: Para verificar …

4
Simule uma distribuição uniforme em um disco
Eu estava tentando simular a injeção de pontos aleatórios dentro de um círculo, de forma que qualquer parte do círculo tivesse a mesma probabilidade de ter um defeito. Eu esperava que a contagem por área da distribuição resultante seguisse uma distribuição de Poisson se eu dividir o círculo em retângulos …



3
Como exatamente o PCA esparso é melhor que o PCA?
Eu aprendi sobre o PCA algumas aulas atrás na aula e, pesquisando mais sobre esse conceito fascinante, fiquei sabendo sobre o PCA escasso. Eu queria perguntar, se não estou errado, é isso o PCA escasso: No PCA, se você tiver pontos de dados com variáveis , poderá representar cada ponto …

3
Mapa de recursos do kernel gaussiano
No SVM, o kernel gaussiano é definido como: onde x, y \ em \ mathbb {R ^ n} . Não conheço a equação explícita de \ phi . Eu quero saber.K(x,y)=exp(−∥x−y∥222σ2)=ϕ(x)Tϕ(y)K(x,y)=exp⁡(−‖x−y‖222σ2)=ϕ(x)Tϕ(y)K(x,y)=\exp\left({-\frac{\|x-y\|_2^2}{2\sigma^2}}\right)=\phi(x)^T\phi(y)x,y∈Rnx,y∈Rnx, y\in \mathbb{R^n}ϕϕ\phi Eu também quero saber se ∑iciϕ(xi)=ϕ(∑icixi)∑iciϕ(xi)=ϕ(∑icixi)\sum_ic_i\phi(x_i)=\phi \left(\sum_ic_ix_i \right) onde ci∈Rci∈Rc_i\in \mathbb R . Agora, acho que não …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.