Perguntas com a marcação «data-transformation»

Reexpressão matemática, geralmente não linear, dos valores dos dados. Os dados são frequentemente transformados para atender às premissas de um modelo estatístico ou para tornar os resultados de uma análise mais interpretáveis.








3
Quando as escalas de log são apropriadas?
Eu li que o uso de escalas de log quando gráficos / gráficos é apropriado em determinadas circunstâncias, como o eixo y em um gráfico de séries temporais. No entanto, não consegui encontrar uma explicação definitiva sobre por que esse é o caso, ou quando mais seria apropriado. Lembre-se de …


1
Codificação one-hot vs dummy no Scikit-learn
Existem duas maneiras diferentes de codificar variáveis ​​categóricas. Digamos, uma variável categórica tem n valores. A codificação one-hot converte-a em n variáveis, enquanto a codificação fictícia converte-a em n-1 variáveis. Se tivermos k variáveis ​​categóricas, cada uma com n valores. Uma codificação quente termina com variáveis kn , enquanto a …

1
Como aplicar a padronização / normalização ao treinamento e ao conjunto de testes se a previsão é o objetivo?
Transformo todos os meus dados ou dobras (se o CV for aplicado) ao mesmo tempo? por exemplo (allData - mean(allData)) / sd(allData) Transformo trainset e testset separadamente? por exemplo (trainData - mean(trainData)) / sd(trainData) (testData - mean(testData)) / sd(testData) Ou eu transformo o trainset e uso cálculos no testset? por …

3
Interpretação do preditor e / ou resposta transformada em log
Gostaria de saber se faz diferença na interpretação se apenas as variáveis ​​dependentes, dependentes e independentes ou apenas as independentes são transformadas em log. Considere o caso de log(DV) = Intercept + B1*IV + Error Eu posso interpretar o IV como o aumento percentual, mas como isso muda quando eu …
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

4
Normalização vs. escala
Qual é a diferença entre 'Normalização' e 'Escalonamento' de dados? Até agora, pensei que os dois termos se referissem ao mesmo processo, mas agora percebo que há algo mais que não sei / entendo. Além disso, se houver uma diferença entre Normalização e Escalonamento, quando devemos usar a Normalização, mas …

1
Regressão: transformando variáveis
Ao transformar variáveis, você precisa usar a mesma transformação? Por exemplo, posso escolher variáveis ​​transformadas de maneira diferente, como em: Seja idade, duração do emprego, duração da residência e renda.x1, x2, x3x1,x2,x3x_1,x_2,x_3 Y = B1*sqrt(x1) + B2*-1/(x2) + B3*log(x3) Ou você deve ser consistente com suas transformações e usar o …


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.