Perguntas com a marcação «regression»

Técnicas para analisar o relacionamento entre uma (ou mais) variáveis ​​"dependentes" e variáveis ​​"independentes".

1
Como calcular manualmente o dfbetas
Estou tentando replicar o que a função dfbetas()faz R . dfbeta() não é um problema ... Aqui está um conjunto de vetores: x <- c(0.512, 0.166, -0.142, -0.614, 12.72) y <- c(0.545, -0.02, -0.137, -0.751, 1.344) Se eu encaixar dois modelos de regressão da seguinte maneira: fit1 <- lm(y ~ …

1
Escolha entre diferentes regressões robustas em R
Estou escrevendo um programa para avaliar imóveis e realmente não entendo as diferenças entre alguns modelos de regressão robustos, é por isso que não sei qual escolher. Eu tentei lmrob, ltsRege rlm. para o mesmo conjunto de dados, todos os três métodos forneceram valores diferentes para os coeficientes. Eu pensei …


3
Encontre distribuição e transforme em distribuição normal
Eu tenho dados que descrevem com que frequência um evento ocorre durante uma hora ("número por hora", nph) e quanto tempo os eventos duram ("duração em segundos por hora", dph). Estes são os dados originais: nph <- c(2.50000000003638, 3.78947368414551, 1.51456310682008, 5.84686774940732, 4.58823529414907, 5.59999999993481, 5.06666666666667, 11.6470588233699, 1.99999999998209, NA, 4.46153846149851, 18, 1.05882352939726, …
8 normal-distribution  data-transformation  logistic  generalized-linear-model  ridge-regression  t-test  wilcoxon-signed-rank  paired-data  naive-bayes  distributions  logistic  goodness-of-fit  time-series  eviews  ecm  panel-data  reliability  psychometrics  validity  cronbachs-alpha  self-study  random-variable  expected-value  median  regression  self-study  multiple-regression  linear-model  forecasting  prediction-interval  normal-distribution  excel  bayesian  multivariate-analysis  modeling  predictive-models  canonical-correlation  rbm  time-series  machine-learning  neural-networks  fishers-exact  factorisation-theorem  svm  prediction  linear  reinforcement-learning  cdf  probability-inequalities  ecdf  time-series  kalman-filter  state-space-models  dynamic-regression  index-decomposition  sampling  stratification  cluster-sample  survey-sampling  distributions  maximum-likelihood  gamma-distribution 

5
Por que os regressores irrelevantes se tornam estatisticamente significativos em amostras grandes?
Estou tentando entender melhor a significância estatística, os tamanhos dos efeitos e similares. Tenho uma percepção (talvez errada) de que mesmo regressores irrelevantes geralmente se tornam estatisticamente significativos em grandes amostras . Por irrelevante, quero dizer que não há explicação no assunto por que o regressor deve estar relacionado à …

2
Distribuições inclinadas para regressão logística
Tenho desenvolvido um modelo de regressão logística baseado em dados retrospectivos de um banco de dados nacional de trauma de traumatismo craniano no Reino Unido. O principal resultado é a mortalidade em 30 dias (indicada como Outcome30medida). Outras medidas em todo o banco de dados com evidências publicadas de efeito …



1
Como calcular com eficiência o estimador Theil-Sen?
O estimador de Theil-Sen é interessante para mim, no entanto, quando eu o implemento, acabo com algo que escala como O (n ^ 2). Segundo a wikipedia, ele pode ser calculado exatamente em O (n log (n)). Alguém pode me indicar uma implementação eficiente (python ou mathematica seria melhor, Matlab …

2
Por que deve ser transformado diante dos preditores?
Ambas as respostas nesses tópicos, uma e duas afirmam que deve ser transformado antes de aplicar qualquer outra transformação aos preditores. De fato, o capítulo sobre transformações de Weisberg concentra-se mais em DV do que em preditores, assim como a página de manual powerTransform () do pacote de carros R.YYY …

1
Como exatamente é feita a restrição de centralização da soma (ou média) para splines (também wrt gam de mgcv)?
O processo de geração de dados é: y=sin(x+I(d=0))+sin(x+4∗I(d=1))+I(d=0)z2+3I(d=1)z2+N(0,1)y=sin(x+I(d=0))+sin(x+4∗I(d=1))+I(d=0)z2+3I(d=1)z2+N(0,1)y = \text{sin}\Big(x+I(d=0)\Big) + \text{sin}\Big(x+4*I(d=1)\Big) + I(d=0)z^2 + 3I(d=1)z^2 + \mathbb{N}\left(0,1\right) Deixe que ser uma sequência de a de comprimento e ser o factor correspondente . Faça todas as combinações possíveis de para calcular : - 4 4 100 d d ∈ { …




4
Escolhendo um modelo de regressão
Como alguém pode objetivamente (ler "algoritmicamente") selecionar um modelo apropriado para fazer uma regressão linear de mínimos quadrados simples com duas variáveis? Por exemplo, digamos que os dados pareçam mostrar uma tendência quadrática e é gerada uma parábola que se ajusta muito bem aos dados. Como justificamos fazer dessa regressão? …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.