Estatísticas e Big Data regression-coefficients

2

Qual é a maneira correta de determinar quais recursos mais contribuíram para a previsão de um determinado vetor de entrada?

Estou usando regressão logística para classificação binária. Eu tenho um grande conjunto de dados (é altamente desequilibrado: 19: 1). Então, eu uso o scikit-learn LogisticRegression()para treinar 80% dos meus dados rotulados e validado com os outros 20% (observei a área sob ROC e o recall de precisão porque os dados …

9 regression logistic regression-coefficients

1

Interpretação dos coeficientes de regressão com base no método de redimensionamento de Andrew Gelman

Eu tenho dois preditores em um modelo de regressão logística binária: um binário e um contínuo. Meu objetivo principal é comparar os coeficientes dos dois preditores dentro do mesmo modelo. Encontrei a sugestão de Andrew Gelman para padronizar variáveis de entrada de regressão contínua: I) Proposta original (2008): divida o …

8 regression logistic regression-coefficients standardization scales

3

Como executar SVD para atribuir valores ausentes, um exemplo concreto

Eu li os ótimos comentários sobre como lidar com valores ausentes antes de aplicar o SVD, mas gostaria de saber como ele funciona com um exemplo simples: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada a matriz …

8 r missing-data data-imputation svd sampling matlab mcmc importance-sampling predictive-models prediction algorithms graphical-model graph-theory r regression regression-coefficients r-squared r regression modeling confounding residuals fitting glmm zero-inflation overdispersion optimization curve-fitting regression time-series order-statistics bayesian prior uninformative-prior probability discrete-data kolmogorov-smirnov r data-visualization histogram dimensionality-reduction classification clustering accuracy semi-supervised labeling state-space-models t-test biostatistics paired-comparisons paired-data bioinformatics regression logistic multiple-regression mixed-model random-effects-model neural-networks error-propagation numerical-integration time-series missing-data data-imputation probability self-study combinatorics survival cox-model statistical-significance wilcoxon-mann-whitney hypothesis-testing distributions normal-distribution variance t-distribution probability simulation random-walk diffusion hypothesis-testing z-test hypothesis-testing data-transformation lognormal r regression agreement-statistics classification svm mixed-model non-independent observational-study goodness-of-fit residuals confirmatory-factor neural-networks deep-learning

1

Como calcular manualmente o dfbetas

Estou tentando replicar o que a função dfbetas()faz R . dfbeta() não é um problema ... Aqui está um conjunto de vetores: x <- c(0.512, 0.166, -0.142, -0.614, 12.72) y <- c(0.545, -0.02, -0.137, -0.751, 1.344) Se eu encaixar dois modelos de regressão da seguinte maneira: fit1 <- lm(y ~ …

8 r regression regression-coefficients diagnostic

2

Interpretação dos coeficientes de regressão logística com um termo de regularização

Entendo que os coeficientes de uma equação logística podem ser interpretados como uma razão ímpar. Se um termo de regularização é adicionado ao controle para o ajuste excessivo, como isso altera a interpretação dos coeficientes?

8 logistic interpretation regression-coefficients regularization odds-ratio

2

Por que um modelo estatístico superajustaria se recebesse um grande conjunto de dados?

Meu projeto atual pode exigir que eu construa um modelo para prever o comportamento de um determinado grupo de pessoas. o conjunto de dados de treinamento contém apenas 6 variáveis (id é apenas para fins de identificação): id, age, income, gender, job category, monthly spend em que monthly spendé a …

8 modeling large-data overfitting clustering algorithms error spatial r regression predictive-models linear-model average measurement-error weighted-mean error-propagation python standard-error weighted-regression hypothesis-testing time-series machine-learning self-study arima regression correlation anova statistical-significance excel r regression distributions statistical-significance contingency-tables regression optimization measurement-error loss-functions image-processing java panel-data probability conditional-probability r lme4-nlme model-comparison time-series probability probability conditional-probability logistic multiple-regression model-selection r regression model-based-clustering svm feature-selection feature-construction time-series forecasting stationarity r distributions bootstrap r distributions estimation maximum-likelihood garch references probability conditional-probability regression logistic regression-coefficients model-comparison confidence-interval r regression r generalized-linear-model outliers robust regression classification categorical-data r association-rules machine-learning distributions posterior likelihood r hypothesis-testing normality-assumption missing-data convergence expectation-maximization regression self-study categorical-data regression simulation regression self-study self-study gamma-distribution modeling microarray synthetic-data

1

Contribuição de cada covariável para uma única previsão em um modelo de regressão logística

Digamos, por exemplo, que temos um modelo de regressão logística que gera a probabilidade de um paciente desenvolver uma doença específica com base em muitas covariáveis. Podemos ter uma idéia da magnitude e direção do efeito de cada covariável em geral, examinando os coeficientes do modelo e considerando a mudança …

8 logistic regression-coefficients model

4

Como faço para referenciar os erros padrão do coeficiente de um modelo de regressão? [fechadas]

Fechadas. Esta questão está fora de tópico . No momento, não está aceitando respostas. Deseja melhorar esta pergunta? Atualize a pergunta para que ela esteja no tópico de Validação cruzada. Fechado há 3 anos . Estimate Std. Error t value Pr(>|t|) (Intercept) 10.2758 0.5185 19.817 < 2e-16 *** rprice2 -1.8581 …

8 r regression-coefficients

2

Os testes t dos coeficientes estão em testes post hoc de regressão múltipla?

Na regressão múltipla, se um teste F global for significativo, então os testes t (ou testes de Wald) para os coeficientes são considerados comparações múltiplas e testes post hoc e devem ser ajustados?

8 regression multiple-comparisons regression-coefficients

3

Interpretação do coeficiente em um modelo de regressão linear com variáveis categóricas

Vou dar meus exemplos com chamadas R. Primeiro, um exemplo simples de regressão linear com uma variável dependente 'vida útil' e duas variáveis explicativas contínuas. data.frame(height=runif(4000,160,200))->human.life human.life$weight=runif(4000,50,120) human.life$lifespan=sample(45:90,4000,replace=TRUE) summary(lm(lifespan~1+height+weight,data=human.life)) Call: lm(formula = lifespan ~ 1 + height + weight, data = human.life) Residuals: Min 1Q Median 3Q Max -23.0257 -11.9124 …

8 r multiple-regression interpretation regression-coefficients

2

Quando usar a regressão de Ridge e de Lasso. O que pode ser alcançado ao usar essas técnicas, em vez do modelo de regressão linear

Estou ansioso para aprender mais sobre as técnicas de regressão regularizadas, como a regressão de Ridge e Lasso. Eu gostaria de saber o que pode ser alcançado usando essas técnicas quando comparado ao modelo de regressão linear. Também em que situação devemos adotar essas técnicas. E o que torna essas …

8 multiple-regression regression-coefficients regularization ridge-regression

4

A média de betas de Y ~ X e X ~ Y é válida?

Estou interessado na relação entre duas variáveis de série temporal: e . As duas variáveis estão relacionadas entre si, e não está claro pela teoria qual delas causa a outra. YYYXXX Dado isso, não têm boas razões para preferir a regressão linear Y= α + βXY=α+βX Y = \alpha + …

7 regression regression-coefficients

3

Convertendo o coeficiente beta da matriz para notação escalar na regressão OLS

Descobri para meus exames de econometria que, se eu esquecer a notação escalar, muitas vezes posso me salvar lembrando a notação da matriz e trabalhando para trás. No entanto, o seguinte me confundiu. Dada a estimativa simples yi^=β0^+β1^xi1yi^=β0^+β1^xi1\hat{y_i} = \hat{\beta_0} + \hat{\beta_1}x_{i1} Como é que vamos β^=(X′X)−1X′yβ^=(X′X)−1X′y\boldsymbol{\hat{\beta}} = \boldsymbol{(X'X)}^{-1}\boldsymbol{X'y} para …

7 regression least-squares regression-coefficients matrix notation

1

Qual é a diferença entre o uso de interceptações e inclinações aleatórias em vez de regressões separadas por sujeito?

Gravei um DV e IV de 20 participantes. O IV é uma medida repetida, e meu objetivo é ver como a variação no IV pode explicar as variações no DV. Mais especificamente, quero um coeficiente beta para cada participante. Meu primeiro pensamento foi montar um modelo linear de efeitos mistos …

7 regression mixed-model regression-coefficients

Perguntas com a marcação «regression-coefficients»