Perguntas com a marcação «confounding»

Em modelos estatísticos, confundimento é dito ocorrer quando a dependência aparente da resposta em um preditor é parcial ou totalmente devido à dependência de ambos em uma terceira variável não incluída no modelo, ou dependência de uma combinação linear de outras variáveis ​​incluídas em o modelo. A confusão com uma variável incluída em um modelo costuma ser chamada de multicolinearidade. Um sinônimo é * aliasing *, usado no planejamento de experimentos.



3
Qual hospital deve ser escolhido? Um tem uma taxa de sucesso mais alta, mas o outro tem uma taxa de sucesso geral mais alta
Esta pergunta foi migrada do Mathematics Stack Exchange porque pode ser respondida em Validação cruzada. Migrou há 7 anos . Tenho uma pergunta sobre algo que meu professor de estatística disse sobre o seguinte problema. Minha pergunta nem é sobre a ocorrência do paradoxo de Simpson nessa situação. Minha pergunta …


1
Confounder - definição
De acordo com M. Katz em seu livro Multivariable analysis (Seção 1.2, página 6), " Um fator de confusão está associado ao fator de risco e causalmente relacionado ao resultado " . Por que o fator de confusão deve estar causalmente relacionado ao resultado? Seria suficiente o fator de confusão …



3
Um potencial conflito em um experimento
Visão geral da pergunta Aviso: Esta pergunta requer muita configuração. Por favor, tenha paciência comigo. Um colega meu e eu estamos trabalhando em um experimento. O design deve contornar um grande número de restrições, que listarei abaixo. Eu desenvolvi um design que satisfaz as restrições e que nos fornece estimativas …




1
Por que Anova () e drop1 () forneceram respostas diferentes para os GLMMs?
Eu tenho um GLMM do formulário: lmer(present? ~ factor1 + factor2 + continuous + factor1*continuous + (1 | factor3), family=binomial) Quando uso drop1(model, test="Chi"), obtenho resultados diferentes dos que utilizo Anova(model, type="III")na embalagem do carro ou summary(model). Estes dois últimos dão as mesmas respostas. Usando um monte de dados fabricados, …
10 r  anova  glmm  r  mixed-model  bootstrap  sample-size  cross-validation  roc  auc  sampling  stratification  random-allocation  logistic  stata  interpretation  proportion  r  regression  multiple-regression  linear-model  lm  r  cross-validation  cart  rpart  logistic  generalized-linear-model  econometrics  experiment-design  causality  instrumental-variables  random-allocation  predictive-models  data-mining  estimation  contingency-tables  epidemiology  standard-deviation  mean  ancova  psychology  statistical-significance  cross-validation  synthetic-data  poisson-distribution  negative-binomial  bioinformatics  sequence-analysis  distributions  binomial  classification  k-means  distance  unsupervised-learning  euclidean  correlation  chi-squared  spearman-rho  forecasting  excel  exponential-smoothing  binomial  sample-size  r  change-point  wilcoxon-signed-rank  ranks  clustering  matlab  covariance  covariance-matrix  normal-distribution  simulation  random-generation  bivariate  standardization  confounding  z-statistic  forecasting  arima  minitab  poisson-distribution  negative-binomial  poisson-regression  overdispersion  probability  self-study  markov-process  estimation  maximum-likelihood  classification  pca  group-differences  chi-squared  survival  missing-data  contingency-tables  anova  proportion 

3
Como executar SVD para atribuir valores ausentes, um exemplo concreto
Eu li os ótimos comentários sobre como lidar com valores ausentes antes de aplicar o SVD, mas gostaria de saber como ele funciona com um exemplo simples: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada a matriz …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

2
Viés de superação e variáveis ​​de confusão
Pelo que entendi, a correspondência é uma maneira de identificar a causalidade nos estudos observacionais. Combinando observações "semelhantes" e comparando aquelas que receberam ou não tratamento, você pode considerar isso como uma espécie de quase experimento. O que é overmatching? Que tipo de viés ele introduz? Vi principalmente a correspondência …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.