Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados

3
Linearidade do PCA
O PCA é considerado um procedimento linear, no entanto: P C A (X) ≠ P C A ( X1 1) + P C A ( X2) + … + P C A ( Xn) ,PCA(X)≠PCA(X1)+PCA(X2)+…+PCA(Xn),\mathrm{PCA}(X)\neq \mathrm{PCA}(X_1)+\mathrm{PCA}(X_2)+\ldots+\mathrm{PCA}(X_n), onde . Isto quer dizer que os autovetores obtidos pelos PCAs nas matrizes de …
35 pca  linear 


5
Pense como um bayesiano, verifique como um freqüentador: O que isso significa?
Estou vendo alguns slides de palestras em um curso de ciência de dados que pode ser encontrado aqui: https://github.com/cs109/2015/blob/master/Lectures/01-Introduction.pdf Infelizmente, não consigo ver o vídeo desta palestra e, a certa altura do slide, o apresentador tem o seguinte texto: Alguns princípios fundamentais Pense como um bayesiano, verifique como um freqüentista …



3
Como selecionar um método de clustering? Como validar uma solução de cluster (para garantir a escolha do método)?
Um dos maiores problemas com a análise de cluster é que podemos ter que tirar conclusões diferentes quando baseamos nos diferentes métodos de cluster usados ​​(incluindo diferentes métodos de ligação no cluster hierárquico). Gostaria de saber sua opinião sobre isso - qual método você selecionará e como. Pode-se dizer "o …


4
Como o LSTM evita o problema de gradiente de fuga?
O LSTM foi inventado especificamente para evitar o problema do gradiente de fuga. Supõe-se que isso seja feito com o Constant Error Carousel (CEC), que no diagrama abaixo (de Greff et al. ) Corresponde ao loop em torno da célula . (fonte: deeplearning4j.org ) E eu entendo que essa parte …

6
Todos os métodos de simulação são alguma forma de Monte Carlo?
Existe um método de simulação que não seja Monte Carlo? Todos os métodos de simulação envolvem a substituição de números aleatórios na função para encontrar um intervalo de valores para a função. Então, todos os métodos de simulação são essencialmente os métodos de Monte Carlo?


6
Melhor método para séries temporais curtas
Tenho uma pergunta relacionada à modelagem de séries temporais curtas. Não é uma questão se modelá-los , mas como. Que método você recomendaria para modelar séries temporais (muito) curtas (por exemplo, comprimento )? Por "melhor", quero dizer aqui o mais robusto, que é o menos propenso a erros devido ao …

3
PCA e a divisão trem / teste
Eu tenho um conjunto de dados para o qual tenho vários conjuntos de rótulos binários. Para cada conjunto de rótulos, treino um classificador, avaliando-o por validação cruzada. Quero reduzir a dimensionalidade usando a análise de componentes principais (PCA). Minha pergunta é: É possível executar o PCA uma vez para todo …


4
Como uma distribuição pode ter média e variação infinitas?
Seria apreciado se os seguintes exemplos pudessem ser dados: Uma distribuição com média infinita e variação infinita. Uma distribuição com média infinita e variância finita. Uma distribuição com média finita e variância infinita. Uma distribuição com média finita e variância finita. Isso acontece porque eu vejo esses termos desconhecidos (média …

2
Qual é a fórmula ao quadrado R ajustada em lm em R e como deve ser interpretada?
Qual é a fórmula exata usada em R lm() para o quadrado R ajustado? Como eu posso interpretar isso? Fórmulas quadradas de r ajustadas Parece haver várias fórmulas para calcular o quadrado R ajustado. Wherry fórmula de: 1−(1−R2)(n−1)(n−v)1−(1−R2)(n−1)(n−v)1-(1-R^2)\frac{(n-1)}{(n-v)} Fórmula de McNemar: 1−(1−R2)(n−1)(n−v−1)1−(1−R2)(n−1)(n−v−1)1-(1-R^2)\frac{(n-1)}{(n-v-1)} Fórmula do Senhor: 1−(1−R2)(n+v−1)(n−v−1)1−(1−R2)(n+v−1)(n−v−1)1-(1-R^2)\frac{(n+v-1)}{(n-v-1)} Fórmula de Stein: 1−[(n−1)(n−k−1)(n−2)(n−k−2)(n+1)n](1−R2)1−[(n−1)(n−k−1)(n−2)(n−k−2)(n+1)n](1−R2)1-\big[\frac{(n-1)}{(n-k-1)}\frac{(n-2)}{(n-k-2)}\frac{(n+1)}{n}\big](1-R^2) …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.