Perguntas com a marcação «resampling»

A reamostragem está tirando uma amostra de uma amostra. Usos comuns são jackknifing (tirando uma subamostra, por exemplo, todos os valores, exceto 1) e bootstrapping (amostragem com substituição). Essas técnicas podem fornecer uma estimativa robusta de uma distribuição amostral quando seria difícil ou impossível derivar analiticamente.

3
Como reamostrar em R sem repetir permutações?
Em R, se eu definir.seed () e usar a função de amostra para randomizar uma lista, posso garantir que não gerarei a mesma permutação? ie ... set.seed(25) limit <- 3 myindex <- seq(0,limit) for (x in seq(1,factorial(limit))) { permutations <- sample(myindex) print(permutations) } Isso produz [1] 1 2 0 3 …



1
Coeficiente de Gini e limites de erro
Eu tenho uma série temporal de dados com N = 14 contagens em cada ponto do tempo e quero calcular o coeficiente de Gini e um erro padrão para essa estimativa em cada ponto do tempo. Como tenho apenas N = 14 contagens em cada momento, procedi calculando a variação …



2
Bom texto para reamostragem?
O grupo pode recomendar um bom texto / recurso de introdução às técnicas de reamostragem aplicadas? Especificamente, estou interessado em alternativas aos testes paramétricos clássicos (por exemplo, testes t, ANOVA, ANCOVA) para comparar grupos quando suposições como normalidade são claramente violadas. Um exemplo de tipo de problema que eu gostaria …

1
Qual modelo de aprendizagem profunda pode classificar categorias que não são mutuamente exclusivas
Exemplos: Eu tenho uma frase na descrição do trabalho: "Java senior engineer in UK". Eu quero usar um modelo de aprendizado profundo para prever em duas categorias: English e IT jobs. Se eu usar o modelo de classificação tradicional, ele poderá prever apenas 1 rótulo com softmaxfunção na última camada. …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

2
Tamanho das amostras de inicialização
Estou aprendendo sobre o bootstrap como meio de estimar a variação de uma estatística de amostra. Eu tenho uma dúvida básica. Citando http://web.stanford.edu/class/psych252/tutorials/doBootstrapPrimer.pdf : • Quantas observações devemos refazer a amostra? Uma boa sugestão é o tamanho da amostra original. Como podemos reamostrar tantas observações quanto na amostra original? Se …

1
Sobre-amostragem com variáveis ​​categóricas
Gostaria de executar uma combinação de superamostragem e subamostragem para equilibrar meu conjunto de dados com aproximadamente 4000 clientes divididos em dois grupos, onde um dos grupos tem uma proporção de aproximadamente 15%. Examinei o SMOTE ( http://www.inside-r.org/packages/cran/DMwR/docs/SMOTE ) e o ROSE ( http://cran.r-project.org/web/packages/ROSE/ ROSE.pdf ), mas ambos criam novas …

1
A reamostragem de autoinicialização pode ser usada para calcular um intervalo de confiança para a variação de um conjunto de dados?
Sei que se você fizer uma nova amostragem de um conjunto de dados várias vezes e calcular a média a cada vez, esses meios seguirão uma distribuição normal (pelo CLT). Portanto, você pode calcular um intervalo de confiança na média do conjunto de dados sem fazer nenhuma suposição sobre a …




2
Subamostra de uma amostra aleatória: amostra aleatória?
Digamos que você tenha uma grande amostra aleatória de jogadores de futebol na Europa, mas você só está interessado no que acontece na Espanha. Você poderia reduzir sua amostra para jogadores da Espanha e ainda chamá-la de amostra aleatória (mas de uma população diferente)? Caso contrário, como você chamaria essa …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.