Estatísticas e Big Data

Perguntas e respostas para pessoas interessadas em estatística, aprendizado de máquina, análise de dados, mineração de dados e visualização de dados


2
Existe alguma vantagem do SVD sobre o PCA?
Sei como calcular matematicamente PCA e SVD e sei que ambos podem ser aplicados à regressão de mínimos quadrados lineares. A principal vantagem do SVD matematicamente parece ser que ele pode ser aplicado a matrizes não quadradas. Ambos focam na decomposição da matrizAlém da vantagem do SVD mencionada, existem vantagens …
20 pca  least-squares  svd 


6
A mediana é um tipo de média, para alguma generalização de "média"?
O conceito de "média" percorre muito mais do que a média aritmética tradicional; estende até o ponto de incluir a mediana? Por analogia, dados brutos ⟶identidadedados brutos ⟶significarmédia bruta ⟶identidade- 1média aritméticadados brutos ⟶destinatáriorecíprocos ⟶significarrecíproco médio ⟶destinatário- 1média harmônicadados brutos ⟶registrologs ⟶significarlog médio ⟶registro- 1média geométricadados brutos ⟶quadradoquadrados ⟶significarquadrado médio …
20 mean  average  median 

2
Métodos para calcular pontuações fatoriais, e qual é a matriz do “coeficiente de pontuação” na análise PCA ou fatorial?
De acordo com meu entendimento, no PCA baseado em correlações, obtemos cargas de fator (= componente principal neste caso) que nada mais são do que correlações entre variáveis ​​e fatores. Agora, quando preciso gerar pontuações fatoriais no SPSS, posso obter diretamente pontuações fatoriais de cada respondente para cada fator. Também …



2
Amostragem de Gibbs versus MH-MCMC geral
Acabei de ler sobre a amostragem de Gibbs e o algoritmo Metropolis Hastings e tenho algumas perguntas. Pelo que entendi, no caso da amostragem de Gibbs, se tivermos um grande problema multivariado, coletamos amostras da distribuição condicional, ou seja, amostramos uma variável enquanto mantemos todas as outras fixas, enquanto no …



2
KKT versus formulação irrestrita da regressão do laço
A regressão penalizada de L1 (aka laço) é apresentada em duas formulações. Seja as duas funções objetivas Então as duas formulações diferentes são sujeito a e, equivalentemente Usando as condições de Karush-Kuhn-Tucker (KKT), é fácil ver como a condição de estacionariedade para a primeira formulação é equivalente a pegar o …


3
Interpretando resultados do spline
Estou tentando ajustar um spline para um GLM usando R. Depois de ajustar o spline, quero poder pegar meu modelo resultante e criar um arquivo de modelagem em uma pasta de trabalho do Excel. Por exemplo, digamos que eu tenho um conjunto de dados em que y é uma função …
20 splines 


2
Como derivar o erro padrão do coeficiente de regressão linear
Para esse modelo de regressão linear univariada, determinado conjunto de dadosyi=β0+β1xi+ϵiyi=β0+β1xi+ϵiy_i = \beta_0 + \beta_1x_i+\epsilon_iD={(x1,y1),...,(xn,yn)}D={(x1,y1),...,(xn,yn)}D=\{(x_1,y_1),...,(x_n,y_n)\} , as estimativas dos coeficientes são β 1 = Σ i x i y i - n ˉ x ˉ y β 0= ˉ y - β 1 ˉ x Aqui está a minha pergunta, …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.