Estatísticas e Big Data factor-analysis

14

Quais são as diferenças entre a análise fatorial e a análise de componentes principais?

Parece que vários pacotes estatísticos que uso envolvem esses dois conceitos. No entanto, estou me perguntando se existem suposições diferentes ou 'formalidades' de dados que devem ser verdadeiras para usar uma sobre a outra. Um exemplo real seria incrivelmente útil.

215 pca factor-analysis

7

PCA em correlação ou covariância?

Quais são as principais diferenças entre realizar a análise de componentes principais (PCA) na matriz de correlação e na matriz de covariância? Eles dão os mesmos resultados?

153 correlation pca covariance factor-analysis

6

Existe algum bom motivo para usar o PCA em vez do EFA? Além disso, o PCA pode substituir a análise fatorial?

Em algumas disciplinas, o PCA (análise de componentes principais) é sistematicamente usado sem qualquer justificativa, e PCA e EFA (análise fatorial exploratória) são considerados sinônimos. Por isso, recentemente usei o PCA para analisar os resultados de um estudo de validação de escala (21 itens na escala Likert de 7 pontos, …

73 pca factor-analysis eda

2

Qual é a relação entre análise de componentes independentes e análise de fatores?

Eu sou novo na Independent Component Analysis (ICA) e tenho apenas uma compreensão rudimentar do método. Parece-me que a ACI é semelhante à Análise Fatorial (FA), com uma exceção: a ACI assume que as variáveis aleatórias observadas são uma combinação linear de componentes / fatores independentes que não são gaussianos, …

67 multivariate-analysis factor-analysis ica

8

O PCA seguido de uma rotação (como o varimax) ainda é PCA?

Eu tentei reproduzir alguma pesquisa (usando PCA) do SPSS em R. Na minha experiência, a principal() função do pacote psychfoi a única função que se aproximou (ou se minha memória me serve bem, inoperante) para corresponder à saída. Para combinar com os mesmos resultados que no SPSS, eu tive que …

63 r spss pca factor-analysis factor-rotation

2

Como a Análise Fatorial explica a covariância, enquanto o PCA explica a variância?

Aqui está uma citação do livro "Reconhecimento de padrões e aprendizado de máquina" de Bishop, seção 12.2.4 "Análise fatorial": De acordo com a parte destacada, análise de factor de captura entre a covariância variáveis na matrizWWW . Eu me pergunto como ? Aqui está como eu entendo isso. Diga é …

37 pca factor-analysis geometry

3

O sinal de pontuações ou cargas no PCA ou FA tem algum significado? Posso reverter o sinal?

Realizei a análise de componentes principais (PCA) com R usando duas funções diferentes ( prcompe princomp) e observei que as pontuações do PCA diferiam no sinal. Como pode ser? Considere isto: set.seed(999) prcomp(data.frame(1:10,rnorm(10)))$x PC1 PC2 [1,] -4.508620 -0.2567655 [2,] -3.373772 -1.1369417 [3,] -2.679669 1.0903445 [4,] -1.615837 0.7108631 [5,] -0.548879 0.3093389 …

37 r pca factor-analysis

1

Qual é a razão intuitiva por trás das rotações na Análise Fatorial / PCA e como selecionar a rotação apropriada?

Minhas perguntas Qual é a razão intuitiva por trás da rotação de fatores na análise fatorial (ou componentes no PCA)? Meu entendimento é que, se as variáveis são quase igualmente carregadas nos principais componentes (ou fatores), então obviamente é difícil diferenciar os componentes. Portanto, neste caso, pode-se usar a rotação …

33 pca interpretation factor-analysis dimensionality-reduction factor-rotation

3

PCA na correlação ou covariância: o PCA na correlação faz algum sentido? [fechadas]

Na análise de componentes principais (PCA), pode-se escolher a matriz de covariância ou a matriz de correlação para encontrar os componentes (de seus respectivos vetores próprios). Eles fornecem resultados diferentes (cargas de PC e pontuações), porque os vetores próprios entre as duas matrizes não são iguais. Meu entendimento é que …

32 pca factor-analysis

1

Fazendo análise de componente principal ou análise fatorial em dados binários

Eu tenho um conjunto de dados com um grande número de respostas Sim / Não. Posso usar componentes principais (PCA) ou qualquer outra análise de redução de dados (como análise fatorial) para esse tipo de dados? Por favor, informe como eu faço isso usando o SPSS.

30 spss categorical-data pca factor-analysis binary-data

5

Como lidar com dados hierárquicos / aninhados no aprendizado de máquina

Vou explicar meu problema com um exemplo. Suponha que você queira prever a renda de um indivíduo, com alguns atributos: {Idade, Sexo, País, Região, Cidade}. Você tem um conjunto de dados de treinamento como esse train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", …

29 regression machine-learning multilevel-analysis correlation dataset spatial paired-comparisons cross-correlation clustering aic bic dependent-variable k-means mean standard-error measurement-error errors-in-variables regression multiple-regression pca linear-model dimensionality-reduction machine-learning neural-networks deep-learning conv-neural-network computer-vision clustering spss r weighted-data wilcoxon-signed-rank bayesian hierarchical-bayesian bugs stan distributions categorical-data variance ecology r survival regression r-squared descriptive-statistics cross-section maximum-likelihood factor-analysis likert r multiple-imputation propensity-scores distributions t-test logit probit z-test confidence-interval poisson-distribution deep-learning conv-neural-network residual-networks r survey wilcoxon-mann-whitney ranking kruskal-wallis bias loss-functions frequentist decision-theory risk machine-learning distributions normal-distribution multivariate-analysis inference dataset factor-analysis survey multilevel-analysis clinical-trials

1

Melhores métodos de extração de fatores na análise fatorial

O SPSS oferece vários métodos de extração fatorial: Componentes principais (que não são análise de fatores) Mínimos quadrados não ponderados Mínimos quadrados generalizados Máxima verossimilhança Eixo principal Factoring alfa Factoring de imagem Ignorando o primeiro método, que não é análise fatorial (mas análise de componentes principais, PCA), qual desses métodos …

29 spss pca factor-analysis

1

Existe análise fatorial ou PCA para dados ordinais ou binários?

Concluí a análise de componentes principais (PCA), análise fatorial exploratória (EFA) e análise fatorial confirmatória (CFA), tratando dados em escala likert (respostas em cinco níveis: nenhuma, um pouco, algumas, etc.) como contínua variável. Em seguida, usando Lavaan, repeti o CFA definindo as variáveis como categóricas. Gostaria de saber para que …

28 pca factor-analysis ordinal-data binary-data likert

1

Cálculo da repetibilidade dos efeitos de um modelo mais antigo

Acabei de me deparar com este artigo , que descreve como calcular a repetibilidade (também conhecida como confiabilidade, também conhecida como correlação intraclasse) de uma medição via modelagem de efeitos mistos. O código R seria: #fit the model fit = lmer(dv~(1|unit),data=my_data) #obtain the variance estimates vc = VarCorr(fit) residual_var = …

28 mixed-model reliability intraclass-correlation repeatability spss factor-analysis survey modeling cross-validation error curve-fitting mediation correlation clustering sampling machine-learning probability classification metric r project-management optimization svm python dataset quality-control checking clustering distributions anova factor-analysis exponential poisson-distribution generalized-linear-model deviance machine-learning k-nearest-neighbour r hypothesis-testing t-test r variance levenes-test bayesian software bayesian-network regression repeated-measures least-squares change-scores variance chi-squared variance nonlinear-regression regression-coefficients multiple-comparisons p-value r statistical-significance excel sampling sample r distributions interpretation goodness-of-fit normality-assumption probability self-study distributions references theory time-series clustering econometrics binomial hypothesis-testing variance t-test paired-comparisons statistical-significance ab-test r references hypothesis-testing t-test normality-assumption wilcoxon-mann-whitney central-limit-theorem t-test data-visualization interactive-visualization goodness-of-fit

1

Os graus de liberdade podem ser um número não inteiro?

Quando uso o GAM, o DF residual é (última linha do código). O que isso significa? Indo além do exemplo do GAM, em geral, o número de graus de liberdade pode ser um número não inteiro?26,626.626.6 > library(gam) > summary(gam(mpg~lo(wt),data=mtcars)) Call: gam(formula = mpg ~ lo(wt), data = mtcars) Deviance …

27 r degrees-of-freedom gam machine-learning pca lasso probability self-study bootstrap expected-value regression machine-learning linear-model probability simulation random-generation machine-learning distributions svm libsvm classification pca multivariate-analysis feature-selection archaeology r regression dataset simulation r regression time-series forecasting predictive-models r mean sem lavaan machine-learning regularization regression conv-neural-network convolution classification deep-learning conv-neural-network regression categorical-data econometrics r confirmatory-factor scale-invariance self-study unbiased-estimator mse regression residuals sampling random-variable sample probability random-variable convergence r survival weibull references autocorrelation hypothesis-testing distributions correlation regression statistical-significance regression-coefficients univariate categorical-data chi-squared regression machine-learning multiple-regression categorical-data linear-model pca factor-analysis factor-rotation classification scikit-learn logistic p-value regression panel-data multilevel-analysis variance bootstrap bias probability r distributions interquartile time-series hypothesis-testing normal-distribution normality-assumption kurtosis arima panel-data stata clustered-standard-errors machine-learning optimization lasso multivariate-analysis ancova machine-learning cross-validation

Perguntas com a marcação «factor-analysis»