Perguntas com a marcação «data-transformation»

Reexpressão matemática, geralmente não linear, dos valores dos dados. Os dados são frequentemente transformados para atender às premissas de um modelo estatístico ou para tornar os resultados de uma análise mais interpretáveis.




3
Essas fórmulas para transformar P, LSD, MSD, HSD, CI e SE em uma estimativa exata ou inflada / conservadora de corretas?
fundo Estou conduzindo uma meta-análise que inclui dados publicados anteriormente. Frequentemente, as diferenças entre os tratamentos são relatadas com valores de P, diferenças menos significativas (LSD) e outras estatísticas, mas não fornecem estimativa direta da variação. No contexto do modelo que estou usando, uma superestimação de variação é aceitável. Problema …




2
Transformar variáveis ​​contínuas para regressão logística
Tenho dados de pesquisas grandes, uma variável de resultado binário e muitas variáveis ​​explicativas, incluindo binárias e contínuas. Estou construindo conjuntos de modelos (experimentando com GLM e GLM misto) e usando abordagens teóricas da informação para selecionar o modelo superior. Examinei cuidadosamente as explicações (contínuas e categóricas) para correlações e …


2
Agrupamento de dados muito distorcidos e contados: alguma sugestão a ser feita (transformar etc)?
Problema básico Aqui está o meu problema básico: estou tentando agrupar um conjunto de dados que contém algumas variáveis ​​muito assimétricas com contagens. As variáveis ​​contêm muitos zeros e, portanto, não são muito informativas para o meu procedimento de agrupamento - o que provavelmente é um algoritmo k-means. Tudo bem, …

1
Variáveis ​​padronizadas de VS centradas
Encontrei muitos posts úteis sobre variáveis ​​independentes padronizadas e variáveis ​​independentes centralizadas no stats.stackexchange.com, mas ainda estou um pouco confuso. Estou lhe pedindo uma avaliação do que entendi. Além disso, se o que se segue não estiver correto, você poderia me corrigir? Como padronizar. As variáveis ​​padronizadas são obtidas subtraindo …


2
Regressão com variável independente inversa
Vamos supor que eu tenha um vetor - de variáveis ​​dependentes e um vetor - de variável independente. Quando é plotado contra , vejo que há uma relação linear (tendência ascendente) entre os dois. Agora, isso também significa que há uma tendência de queda linear entre e .NNNYYYNNNXXXYYY1X1X\frac{1}{X}YYYXXX Agora, se …

3
Como a re-ponderação dos dados de diversidade da Pesquisa da Comunidade Americana afetaria suas margens de erro?
Histórico: minha organização atualmente compara suas estatísticas de diversidade da força de trabalho (por exemplo,% de pessoas com deficiência,% de mulheres,% de veteranas) com a disponibilidade total de força de trabalho para esses grupos com base no American Community Survey (um projeto de pesquisa do US Census Bureau). Essa é …

1
Como incorporar um outlier inovador na observação 48 no meu modelo ARIMA?
Estou trabalhando em um conjunto de dados. Depois de usar algumas técnicas de identificação de modelos, criei um modelo ARIMA (0,2,1). Usei a detectIOfunção no pacote TSAem R para detectar um outlier inovador (IO) na 48ª observação do meu conjunto de dados original. Como faço para incorporar esse erro externo …
10 r  time-series  arima  outliers  hypergeometric  fishers-exact  r  time-series  intraclass-correlation  r  logistic  glmm  clogit  mixed-model  spss  repeated-measures  ancova  machine-learning  python  scikit-learn  distributions  data-transformation  stochastic-processes  web  standard-deviation  r  machine-learning  spatial  similarities  spatio-temporal  binomial  sparse  poisson-process  r  regression  nonparametric  r  regression  logistic  simulation  power-analysis  r  svm  random-forest  anova  repeated-measures  manova  regression  statistical-significance  cross-validation  group-differences  model-comparison  r  spatial  model-evaluation  parallel-computing  generalized-least-squares  r  stata  fitting  mixture  hypothesis-testing  categorical-data  hypothesis-testing  anova  statistical-significance  repeated-measures  likert  wilcoxon-mann-whitney  boxplot  statistical-significance  confidence-interval  forecasting  prediction-interval  regression  categorical-data  stata  least-squares  experiment-design  skewness  reliability  cronbachs-alpha  r  regression  splines  maximum-likelihood  modeling  likelihood-ratio  profile-likelihood  nested-models 

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.