Perguntas com a marcação «data-transformation»

Reexpressão matemática, geralmente não linear, dos valores dos dados. Os dados são frequentemente transformados para atender às premissas de um modelo estatístico ou para tornar os resultados de uma análise mais interpretáveis.

2
Transformando dados de proporção: quando a raiz quadrada arcsin não é suficiente
Existe uma alternativa (mais forte?) Para a transformação da raiz quadrada do arcsin para dados de porcentagem / proporção? No conjunto de dados em que estou trabalhando no momento, a heterocedasticidade acentuada permanece após a aplicação dessa transformação, ou seja, o gráfico de resíduos versus valores ajustados ainda é muito …

4
Quais são os valores corretos para precisão e rechamada em casos extremos?
Precisão é definida como: p = true positives / (true positives + false positives) É verdade que, como true positivese false positivesabordagem 0, a precisão se aproxima de 1? Mesma pergunta para recall: r = true positives / (true positives + false negatives) No momento, estou implementando um teste estatístico …
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

2
Da distribuição uniforme à distribuição exponencial e vice-versa
Esta é provavelmente uma questão trivial, mas minha busca foi infrutífera até agora, incluindo este artigo wikipedia , e o "Compêndio de Distribuições" documento . Se tem uma distribuição uniforme, significa que segue uma distribuição exponencial?XXXeXeXe^X Da mesma forma, se segue uma distribuição exponencial, significa que segue uma distribuição uniforme?YYYln(Y)ln(Y)ln(Y)


2
Uma transformação de log é uma técnica válida para testar dados não normais?
Ao revisar um artigo, os autores declaram: "As variáveis ​​de resultados contínuos que exibem uma distribuição distorcida foram transformadas, usando os logaritmos naturais, antes de os testes t serem conduzidos para satisfazer as premissas de pré-requisito da normalidade". Essa é uma maneira aceitável de analisar dados não normais, principalmente se …


3
O que significa “normalização” e como verificar se uma amostra ou uma distribuição está normalizada?
Eu tenho uma pergunta na qual ele pede para verificar se a distribuição Uniform ( ) está normalizada.Uniform(a,b)Uniform(a,b){\rm Uniform}(a,b) Por um lado, o que significa que qualquer distribuição seja normalizada? E segundo, como vamos verificar se uma distribuição é normalizada ou não? Entendo que ao calcular obtemos dados normalizados , …


2
Comparando AIC de um modelo e sua versão transformada por log
A essência da minha pergunta é esta: Seja Y∈RnY∈RnY \in \mathbb{R}^n uma variável aleatória normal multivariada com média μμ\mu e matriz de covariância ΣΣ\Sigma . Deixe- Z:=log(Y)Z:=log⁡(Y)Z := \log(Y) , ou seja, Zi=log(Yi),i∈{1,…,n}Zi=log⁡(Yi),i∈{1,…,n}Z_i = \log(Y_i), i \in \{1,\ldots,n\} . Como eu comparo o AIC de um modelo adequado às realizações …


2
Retrotransformação dos coeficientes de regressão
Estou fazendo uma regressão linear com uma variável dependente transformada. A transformação a seguir foi feita para que a suposição de normalidade dos resíduos se mantivesse. A variável dependente não transformada foi inclinada negativamente e a transformação a seguir tornou-a quase normal: Y=50−Yorig−−−−−−−−√Y=50−YorigY=\sqrt{50-Y_{orig}} onde é a variável dependente na escala …

2
Por que transformar os dados em log antes de executar a análise de componentes principais?
Estou seguindo um tutorial aqui: http://www.r-bloggers.com/computing-and-visualizing-pca-in-r/ para obter uma melhor compreensão do PCA. O tutorial usa o conjunto de dados Iris e aplica uma transformação de log antes do PCA: Observe que no código a seguir aplicamos uma transformação log para as variáveis contínuas, como sugerido por [1] e conjunto …


2
Derivação da transformação de normalização para GLMs
\newcommand{\E}{\mathbb{E}} Como está a transformação de normalização A(⋅)=∫duV1/3(μ)A(⋅)=∫duV1/3(μ)A(\cdot) = \displaystyle\int\frac{du}{V^{1/3}(\mu)} normalização para a família exponencial derivado? Mais especificamente : tentei seguir o esboço de expansão de Taylor na página 3, slide 1 aqui, mas tenho várias perguntas. Com XXX de uma família exponencial, transformação h(X)h(X)h(X) e κiκi\kappa _i indicando o …

4
Armadilhas a evitar ao transformar dados?
Consegui uma forte relação linear entre minha variável e Y após transformar duplamente a resposta. O modelo era Y ∼ X, mas eu o transformei em √XXXYYYY∼XY∼XY\sim X melhorarR20,19-0,76.YX−−√∼X−−√YX∼X\sqrt{\frac{Y}{X}}\sim \sqrt{X}R2R2R^2 Claramente fiz uma cirurgia decente sobre esse relacionamento. Alguém pode discutir as armadilhas de fazer isso, como perigos de transformações …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.