Perguntas com a marcação «r-squared»

O coeficiente de determinação, geralmente simbolizado por R2, é a proporção da variação total da resposta explicada por um modelo de regressão. Também pode ser usado para vários pseudo-quadrado R propostos, por exemplo, para regressão logística (e outros modelos).



1
Derivação interessante de R ao quadrado
Anos atrás, eu encontrei essa identidade através da experimentação brincando com dados e transformações. Depois de explicar ao meu professor de estatística, ele entrou na aula seguinte com uma prova de uma página, usando notação de vetor e matriz. Infelizmente, perdi o papel que ele me deu. (Isso foi em …

2
Existe uma maneira elegante / perspicaz de entender essa identidade de regressão linear para múltiplos ?
Na regressão linear, encontrei um resultado agradável que, se encaixarmos no modelo E[Y]=β1X1+β2X2+c,E[Y]=β1X1+β2X2+c,E[Y] = \beta_1 X_1 + \beta_2 X_2 + c, então, se padronizarmos e centralizarmos os dados , e ,X 1 X 2YYYX1X1X_1X2X2X_2 R2=Cor(Y,X1)β1+Cor(Y,X2)β2.R2=Cor(Y,X1)β1+Cor(Y,X2)β2.R^2 = \mathrm{Cor}(Y,X_1) \beta_1 + \mathrm{Cor}(Y, X_2) \beta_2. Isso me parece uma versão de 2 variáveis …

1
O quadrado R ajustado procura estimar a pontuação fixa ou a população de pontuação aleatória r-quadrado?
A população r-quadrado pode ser definida assumindo pontuações fixas ou pontuações aleatórias:ρ2ρ2\rho^2 Pontuações fixas: O tamanho da amostra e os valores particulares dos preditores são mantidos fixos. Assim, é a proporção de variância explicada no resultado pela equação de regressão populacional quando os valores do preditor são mantidos constantes.ρ2fρf2\rho^2_f Pontuações …

2
Pode
A página da Wikipedia sobre R2 diz que pode assumir um valor maior que 1. Eu não vejo como isso é possível.R2R2R^2 Valores de fora do intervalo de 0 a 1 pode ocorrer, onde ele é usado para medir a concordância entre os valores observados e modeladas e em que …


3
Como executar SVD para atribuir valores ausentes, um exemplo concreto
Eu li os ótimos comentários sobre como lidar com valores ausentes antes de aplicar o SVD, mas gostaria de saber como ele funciona com um exemplo simples: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada a matriz …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 


1
Escolha entre diferentes regressões robustas em R
Estou escrevendo um programa para avaliar imóveis e realmente não entendo as diferenças entre alguns modelos de regressão robustos, é por isso que não sei qual escolher. Eu tentei lmrob, ltsRege rlm. para o mesmo conjunto de dados, todos os três métodos forneceram valores diferentes para os coeficientes. Eu pensei …




1
Por que entre duas variáveis ​​representa a proporção da variação compartilhada?
Em primeiro lugar, entendo que as discussões sobre geralmente provocam explicações sobre (isto é, o coeficiente de determinação em regressão). O problema que estou procurando responder é generalizar isso para todas as instâncias de correlação entre duas variáveis.R 2r2r2r^2R2R2R^2 Então, fiquei intrigado com a variação compartilhada por um bom tempo. …

2
Lidando com bom desempenho em dados de treinamento e validação, mas muito ruim em dados de teste
Eu tenho um problema de regressão com 5-6k variáveis. Divido meus dados em três conjuntos não sobrepostos: treinamento, validação e teste. Treino usando apenas o conjunto de treinamento e gere muitos modelos diferentes de regressão linear escolhendo um conjunto diferente de 200 variáveis ​​para cada modelo (eu tento cerca de …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.