Perguntas com a marcação «resampling»

A reamostragem está tirando uma amostra de uma amostra. Usos comuns são jackknifing (tirando uma subamostra, por exemplo, todos os valores, exceto 1) e bootstrapping (amostragem com substituição). Essas técnicas podem fornecer uma estimativa robusta de uma distribuição amostral quando seria difícil ou impossível derivar analiticamente.

2
Métodos de reamostragem / simulação: monte carlo, bootstrapping, jackknifing, validação cruzada, testes de randomização e testes de permutação
Estou tentando entender a diferença entre diferentes métodos de reamostragem (simulação de Monte Carlo, inicialização paramétrica, inicialização não paramétrica, jackknifing, validação cruzada, validação cruzada, testes de randomização e testes de permutação) e sua implementação no meu próprio contexto usando R. Digamos que eu tenha a seguinte situação - desejo executar …

5
Você pode se aperfeiçoar treinando algoritmos de aprendizado de máquina usando CV / Bootstrap?
Essa questão pode ser muito aberta para obter uma resposta definitiva, mas espero que não. Algoritmos de aprendizado de máquina, como SVM, GBM, Random Forest etc., geralmente possuem alguns parâmetros livres que, além de algumas orientações básicas, precisam ser ajustados para cada conjunto de dados. Isso geralmente é feito com …


2
Por que usar a validação cruzada estratificada? Por que isso não prejudica o benefício relacionado à variação?
Disseram-me que é benéfico usar a validação cruzada estratificada, especialmente quando as classes de resposta são desequilibradas. Se um objetivo da validação cruzada é ajudar a explicar a aleatoriedade da nossa amostra de dados de treinamento original, certamente fazer com que cada dobra tenha a mesma distribuição de classe funcionaria …


2
Métodos de re-amostragem de sinal de intercalação
Estou usando a biblioteca caretem R para testar vários procedimentos de modelagem. O trainControlobjeto permite especificar um método de re-amostragem. Os métodos são descritos na documentação secção de 2,3 e incluem: boot, boot632, cv, LOOCV, LGOCV, repeatedcve oob. Embora alguns deles sejam fáceis de inferir, nem todos esses métodos estão …
20 r  resampling  caret 

2
Classificação de teste em dados de desequilíbrio superamostrados
Estou trabalhando em dados gravemente desequilibrados. Na literatura, vários métodos são utilizados para reequilibrar os dados usando re-amostragem (super ou sub-amostragem). Duas boas abordagens são: SMOTE: Técnica de sobre-amostragem de minorias sintéticas ( SMOTE ) ADASYN: Abordagem de Amostra Sintética Adaptativa para Aprendizagem Desequilibrada ( ADASYN ) Eu implementei o …

2
Teste para amostragem IID
Como você testaria ou verificaria se a amostragem é IID (independente e identicamente distribuída)? Note que eu não quero dizer Gaussiano e Distribuído Identicamente, apenas IID. E a ideia que me vem à mente é dividir repetidamente a amostra em duas subamostras de tamanho igual, realizar o teste de Kolmogorov-Smirnov …



1
Esse método de reamostragem de séries temporais é conhecido na literatura? Isso tem um nome?
Recentemente, eu estava procurando maneiras de reamostrar séries temporais, de maneiras que Preserve aproximadamente a correlação automática de processos de memória longa. Preservar o domínio das observações (por exemplo, uma série temporal de números inteiros redefinida ainda é uma série temporal de números inteiros). Pode afetar apenas algumas escalas, se …


1
É necessário centralizar ao inicializar a amostra?
Ao ler sobre como aproximar a distribuição da amostra, me deparei com o método de inicialização não paramétrico. Aparentemente, pode-se aproximar a distribuição de pela distribuição de ˉ X ∗ n - ˉ X n , onde ˉ X ∗ nX¯n- μX¯n-μ\bar{X}_n-\muX¯∗n- X¯nX¯n∗-X¯n\bar{X}_n^*-\bar{X}_nX¯∗nX¯n∗\bar{X}_n^* denota a média da amostra da amostra …


5
Como executar a imputação de valores em um número muito grande de pontos de dados?
Eu tenho um conjunto de dados muito grande e faltam cerca de 5% de valores aleatórios. Essas variáveis ​​estão correlacionadas entre si. O exemplo a seguir do conjunto de dados R é apenas um exemplo de brinquedo com dados correlatos simulados. set.seed(123) # matrix of X variable xmat <- matrix(sample(-1:1, …
12 r  random-forest  missing-data  data-imputation  multiple-imputation  large-data  definition  moving-window  self-study  categorical-data  econometrics  standard-error  regression-coefficients  normal-distribution  pdf  lognormal  regression  python  scikit-learn  interpolation  r  self-study  poisson-distribution  chi-squared  matlab  matrix  r  modeling  multinomial  mlogit  choice  monte-carlo  indicator-function  r  aic  garch  likelihood  r  regression  repeated-measures  simulation  multilevel-analysis  chi-squared  expected-value  multinomial  yates-correction  classification  regression  self-study  repeated-measures  references  residuals  confidence-interval  bootstrap  normality-assumption  resampling  entropy  cauchy  clustering  k-means  r  clustering  categorical-data  continuous-data  r  hypothesis-testing  nonparametric  probability  bayesian  pdf  distributions  exponential  repeated-measures  random-effects-model  non-independent  regression  error  regression-to-the-mean  correlation  group-differences  post-hoc  neural-networks  r  time-series  t-test  p-value  normalization  probability  moments  mgf  time-series  model  seasonality  r  anova  generalized-linear-model  proportion  percentage  nonparametric  ranks  weighted-regression  variogram  classification  neural-networks  fuzzy  variance  dimensionality-reduction  confidence-interval  proportion  z-test  r  self-study  pdf 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.