Perguntas com a marcação «data-imputation»

Refere-se a uma classe geral de métodos usados ​​para "preencher" dados ausentes. Os métodos usados ​​para fazer isso normalmente estão relacionados à interpolação (http://en.wikipedia.org/wiki/Interpolation) e exigem suposições sobre o motivo da falta de dados (por exemplo, "falta aleatória")






1
Imputação de uma variável censurada
Eu tenho um conjunto de dados médicos com aproximadamente 200 variáveis. Uma das variáveis ​​é um biomarcador (concentração de uma enzima específica). Sua distribuição está correta, e o problema é que valores acima de um determinado nível são censurados / cortados nesse nível. Portanto, enquanto a média da variável é …

1
Como funciona a imputação de ratos?
Fiquei me perguntando se alguém tinha experiência usando a função de ratos, como descrito em ratos: Imputação multivariada por equações encadeadas em R (JSS 2011 45 (3))? Eu tenho um conjunto de dados com um número de variáveis, cada uma com diferentes graus de dados ausentes. Minha pergunta principal é: …


3
Como executar SVD para atribuir valores ausentes, um exemplo concreto
Eu li os ótimos comentários sobre como lidar com valores ausentes antes de aplicar o SVD, mas gostaria de saber como ele funciona com um exemplo simples: Movie1 Movie2 Movie3 User1 5 4 User2 2 5 5 User3 3 4 User4 1 5 User5 5 1 5 Dada a matriz …
8 r  missing-data  data-imputation  svd  sampling  matlab  mcmc  importance-sampling  predictive-models  prediction  algorithms  graphical-model  graph-theory  r  regression  regression-coefficients  r-squared  r  regression  modeling  confounding  residuals  fitting  glmm  zero-inflation  overdispersion  optimization  curve-fitting  regression  time-series  order-statistics  bayesian  prior  uninformative-prior  probability  discrete-data  kolmogorov-smirnov  r  data-visualization  histogram  dimensionality-reduction  classification  clustering  accuracy  semi-supervised  labeling  state-space-models  t-test  biostatistics  paired-comparisons  paired-data  bioinformatics  regression  logistic  multiple-regression  mixed-model  random-effects-model  neural-networks  error-propagation  numerical-integration  time-series  missing-data  data-imputation  probability  self-study  combinatorics  survival  cox-model  statistical-significance  wilcoxon-mann-whitney  hypothesis-testing  distributions  normal-distribution  variance  t-distribution  probability  simulation  random-walk  diffusion  hypothesis-testing  z-test  hypothesis-testing  data-transformation  lognormal  r  regression  agreement-statistics  classification  svm  mixed-model  non-independent  observational-study  goodness-of-fit  residuals  confirmatory-factor  neural-networks  deep-learning 

2
Como combinar vários conjuntos de dados imputados?
Eu preciso de um único conjunto de dados imputados (por exemplo, para criar um manequim de grupo de países a partir dos dados de renda per capita do país imputado). O R oferece pacotes de pacotes para criar vários dados imputados (por exemplo, Amelia) e combinar resultados de vários conjuntos …



2
Taxas ausentes e imputação múltipla
Existe um limite que seja menos aceitável ao usar a imputação múltipla (MI)? Por exemplo, posso usar o MI se os valores ausentes em uma variável forem 20% dos casos, enquanto outras variáveis ​​tiverem valores ausentes, mas não a um nível tão alto?

1
Processo Guassiano de Imputação de Dados
Recentemente me deparei com Processos Gaussianos em Gelman et al. (2013), e estou tentando aprender mais sobre seu potencial aplicativo para uso na imputação de dados de séries temporais. Os dados de interesse são uma única série temporal variável da freqüência cardíaca de um indivíduo coletada usando um fotopletismograma (PPG; …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.