Perguntas com a marcação «residuals»

Os resíduos de um modelo são os valores reais menos os valores previstos. Muitos modelos estatísticos fazem suposições sobre o erro, que é estimado pelos resíduos.

2
Avaliando modelos de regressão logística
Essa questão surge da minha confusão real sobre como decidir se um modelo logístico é bom o suficiente. Eu tenho modelos que usam o estado dos pares de projetos individuais dois anos após serem formados como uma variável dependente. O resultado é bem-sucedido (1) ou não (0). Eu tenho variáveis …



1
Pacote GBM vs. Caret usando GBM
Estive usando o ajuste de modelo caret, mas depois executei novamente o modelo usando o gbmpacote. Entendo que o caretpacote usa gbme a saída deve ser a mesma. No entanto, apenas um teste rápido usando data(iris)mostra uma discrepância no modelo de cerca de 5% usando RMSE e R ^ 2 …

2
São normalmente distribuídos X e Y com maior probabilidade de resultar em resíduos normalmente distribuídos?
Aqui, a interpretação errônea da suposição de normalidade na regressão linear é discutida (que a 'normalidade' refere-se ao X e / ou Y ao invés dos resíduos), e o pôster pergunta se é possível ter X e Y distribuídos normalmente. e ainda tem resíduos normalmente distribuídos. Minha pergunta é: normalmente …

5
Como executar a imputação de valores em um número muito grande de pontos de dados?
Eu tenho um conjunto de dados muito grande e faltam cerca de 5% de valores aleatórios. Essas variáveis ​​estão correlacionadas entre si. O exemplo a seguir do conjunto de dados R é apenas um exemplo de brinquedo com dados correlatos simulados. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

4
Premissas de distribuição residual de regressão
Por que é necessário colocar a premissa distributiva nos erros, ou seja, yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , comϵi∼N(0,σ2)ϵi∼N(0,σ2)\epsilon_{i} \sim \mathcal{N}(0,\sigma^{2}) . Por que não escrever yi=Xβ+ϵiyi=Xβ+ϵiy_i = X\beta + \epsilon_{i} , comyi∼N(Xβ^,σ2)yi∼N(Xβ^,σ2)y_i \sim \mathcal{N}(X\hat{\beta},\sigma^{2}) , onde em qualquer dos casos ϵi=yi−y^ϵi=yi−y^\epsilon_i = y_i - \hat{y} . Eu vi enfatizar …

2
Por que algumas pessoas testam suposições de modelos semelhantes a regressão em seus dados brutos e outras testam-nas no residual?
Sou estudante de doutorado em psicologia experimental e tento muito melhorar minhas habilidades e conhecimentos sobre como analisar meus dados. Até o meu quinto ano em psicologia, eu pensava que os modelos semelhantes à regressão (por exemplo, ANOVA) assumem o seguinte: normalidade dos dados homogeneidade de variação para os dados …


2
Análise residual de regressão logística
Essa pergunta é geral e prolongada, mas por favor, tenha paciência comigo. No meu aplicativo, tenho muitos conjuntos de dados, cada um consistindo em ~ 20.000 pontos de dados com ~ 50 recursos e uma única variável binária dependente. Estou tentando modelar os conjuntos de dados usando regressão logística regularizada …

1





Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.