Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


2
Quando o t-SNE é enganoso?
Citando um dos autores: A Incorporação Estocástica de Vizinhança Distribuída t (SNE) é uma técnica ( premiada ) para redução de dimensionalidade que é particularmente adequada para a visualização de conjuntos de dados de alta dimensão. Parece ótimo, mas esse é o autor falando. Outra citação do autor (re: a …

3
O sinal de pontuações ou cargas no PCA ou FA tem algum significado? Posso reverter o sinal?
Realizei a análise de componentes principais (PCA) com R usando duas funções diferentes ( prcompe princomp) e observei que as pontuações do PCA diferiam no sinal. Como pode ser? Considere isto: set.seed(999) prcomp(data.frame(1:10,rnorm(10)))$x PC1 PC2 [1,] -4.508620 -0.2567655 [2,] -3.373772 -1.1369417 [3,] -2.679669 1.0903445 [4,] -1.615837 0.7108631 [5,] -0.548879 0.3093389 …
37 r  pca  factor-analysis 

4
Diferença entre previsão e previsão?
Fiquei me perguntando que diferença e relação existem entre previsão e previsão? Especialmente em séries temporais e regressão? Por exemplo, estou correto que: Em séries temporais, a previsão parece significar estimar valores futuros, dados valores passados ​​de uma série temporal. Na regressão, previsão parece significar estimar um valor, seja futuro, …

3
Teste de hipótese de bootstrap vs. permutação
Existem várias técnicas populares de reamostragem, frequentemente usadas na prática, como inicialização, teste de permutação, canivete, etc. Existem inúmeros artigos e livros que discutem essas técnicas, por exemplo, Philip I Good (2010) Permutation, Parametric, and Bootstrap Tests de hipóteses Minha pergunta é qual técnica de reamostragem ganhou mais popularidade e …


5
Análise de séries temporais de validação cruzada
Eu tenho usado o pacote de intercalação no R para criar modelos preditivos para classificação e regressão. O Caret fornece uma interface unificada para ajustar os hiper-parâmetros do modelo por validação cruzada ou correias de inicialização. Por exemplo, se você está construindo um modelo simples de 'vizinhos mais próximos' para …





1
Por que o teste de Mantel é preferível ao de Moran?
O teste de Mantel é amplamente utilizado em estudos biológicos para examinar a correlação entre a distribuição espacial dos animais (posição no espaço) com, por exemplo, sua relação genética, taxa de agressão ou algum outro atributo. Muitos periódicos bons estão usando ( PNAS, Comportamento Animal, Ecologia Molecular ... ). Eu …




Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.