Perguntas com a marcação «linear-model»

Refere-se a qualquer modelo em que uma variável aleatória esteja relacionada a uma ou mais variáveis ​​aleatórias por uma função que seja linear em um número finito de parâmetros.


3
Encontre distribuição e transforme em distribuição normal
Eu tenho dados que descrevem com que frequência um evento ocorre durante uma hora ("número por hora", nph) e quanto tempo os eventos duram ("duração em segundos por hora", dph). Estes são os dados originais: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 


2
Por que um modelo estatístico superajustaria se recebesse um grande conjunto de dados?
Meu projeto atual pode exigir que eu construa um modelo para prever o comportamento de um determinado grupo de pessoas. o conjunto de dados de treinamento contém apenas 6 variáveis ​​(id é apenas para fins de identificação): id, age, income, gender, job category, monthly spend em que monthly spendé a …
8 modeling  large-data  overfitting  clustering  algorithms  error  spatial  r  regression  predictive-models  linear-model  average  measurement-error  weighted-mean  error-propagation  python  standard-error  weighted-regression  hypothesis-testing  time-series  machine-learning  self-study  arima  regression  correlation  anova  statistical-significance  excel  r  regression  distributions  statistical-significance  contingency-tables  regression  optimization  measurement-error  loss-functions  image-processing  java  panel-data  probability  conditional-probability  r  lme4-nlme  model-comparison  time-series  probability  probability  conditional-probability  logistic  multiple-regression  model-selection  r  regression  model-based-clustering  svm  feature-selection  feature-construction  time-series  forecasting  stationarity  r  distributions  bootstrap  r  distributions  estimation  maximum-likelihood  garch  references  probability  conditional-probability  regression  logistic  regression-coefficients  model-comparison  confidence-interval  r  regression  r  generalized-linear-model  outliers  robust  regression  classification  categorical-data  r  association-rules  machine-learning  distributions  posterior  likelihood  r  hypothesis-testing  normality-assumption  missing-data  convergence  expectation-maximization  regression  self-study  categorical-data  regression  simulation  regression  self-study  self-study  gamma-distribution  modeling  microarray  synthetic-data 


1
Regressão monotônica robusta em R
Eu tenho a seguinte tabela em R df <- structure(list(x = structure(c(12458, 12633, 12692, 12830, 13369, 13455, 13458, 13515), class = "Date"), y = c(6080, 6949, 7076, 7818, 0, 0, 10765, 11153)), .Names = c("x", "y"), row.names = c("1", "2", "3", "4", "5", "6", "8", "9"), class = "data.frame") > …

2
Procurando o 'cotovelo' nos dados
Subitização é a enumeração rápida e precisa de telas de baixa numerosidade, diferenciada da contagem por uma não linearidade acentuada no gráfico dos tempos de resposta. Abaixo está um gráfico representativo, de Watson, DG, Maylor, EA e Bruce, LAM (2007). Observe que o tempo médio de enumeração para as exibições …

3
Como avaliar resultados de regressão linear
Eu tenho um problema de regressão linear. Em resumo, eu tenho um conjunto de dados, eu o dividi em dois subconjuntos. Um subconjunto é usado para encontrar a regressão linear (subconjunto de treinamento), outro é usado para avaliá-la (subconjunto de avaliação). Minha pergunta é como avaliar o resultado dessa regressão …



2
Qual é a diferença entre o regressor estocástico e o regressor não estocástico na regressão linear?
Suponha que a especificação de regressão seja yEu=β0 0+β1 1xEu+ϵEu,yi=β0+β1xi+ϵi,y_i=\beta_0+\beta_1x_i+\epsilon_i, Não importa xEuxix_i estocástico ou não, precisaremos assumir que ϵEuϵi\epsilon_i é distribuído da mesma forma para todos Euii. No entanto, sexEuxix_ié uma variável aleatória estocástica em vez de um valor fixo; é necessário outro pressuposto, a saber, que o termo …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.