Perguntas com a marcação «association-measure»

Medidas de associação entre variáveis, um conceito mais geral do que correlação

3
Um exemplo: regressão do LASSO usando glmnet para resultado binário
Estou começando a se envolver com o uso de glmnetcom LASSO Regressão onde meu desfecho de interesse é dicotômica. Criei um pequeno quadro de dados simulado abaixo: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p …
78 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 





1
Qual é a medida de associação adequada de uma variável com um componente PCA (em um gráfico de biplot / carregamento)?
Estou usando FactoMineRpara reduzir meu conjunto de dados de medidas para as variáveis ​​latentes. O mapa variável acima é claro para mim interpretar, mas estou confuso quando se trata das associações entre as variáveis e componente 1. Olhando o mapa variável, ddpe covestá muito perto do componente no mapa, e …



1
Qual é a função de distância ideal para indivíduos quando os atributos são nominais?
Não sei qual função de distância entre indivíduos usar no caso de atributos nominais (categóricos não ordenados). Eu estava lendo alguns livros e eles sugerem a função Correspondência Simples , mas alguns livros sugerem que eu deva alterar os atributos nominais para binários e usar o Coeficiente Jaccard . No …

3
Quais são os métodos estatísticos que posso usar para encontrar combinações populares ou comuns de variáveis ​​categóricas?
Estou fazendo um estudo sobre o uso de drogas múltiplas. Eu tenho um conjunto de dados de 400 viciados em drogas, cada um declarando as drogas que abusam. Existem mais de 10 medicamentos e, portanto, existem grandes combinações possíveis. Recodifiquei a maioria das drogas que eles consomem em variáveis ​​binárias …



3
Calculando Jaccard ou outro coeficiente de associação para dados binários usando multiplicação de matrizes
Quero saber se existe alguma maneira possível de calcular o coeficiente de Jaccard usando a multiplicação de matrizes. Eu usei esse código jaccard_sim <- function(x) { # initialize similarity matrix m <- matrix(NA, nrow=ncol(x),ncol=ncol(x),dimnames=list(colnames(x),colnames(x))) jaccard <- as.data.frame(m) for(i in 1:ncol(x)) { for(j in i:ncol(x)) { jaccard[i,j]= length(which(x[,i] & x[,j])) / …

2

2
Qual é o nome dessa medida de correlação / associação entre variáveis ​​binárias?
Existem várias medidas de associação (ou contingência ou correlação) entre duas variáveis ​​aleatórias binárias e , entre outrasXXXYYY Pearson coeficiente phi V de Cramér Gostaria de saber como o seguinte número se relaciona a medidas conhecidas, se é estatisticamente interessante, e sob qual nome é (possivelmente) discutido:κκ\kappa κ=1−2N|X△Y|κ=1−2N|X△Y|\kappa = 1 …
Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.