Perguntas com a marcação «correlation»

Uma medida do grau de associação linear entre um par de variáveis.

5
Correlações entre variáveis ​​contínuas e categóricas (nominais)
Gostaria de encontrar a correlação entre uma variável contínua (variável dependente) e uma variável categórica (nominal: sexo, variável independente). Os dados contínuos não são normalmente distribuídos. Antes, eu tinha calculado usando o Spearman . No entanto, me disseram que isso não está certo.ρρ\rho Ao pesquisar na internet, descobri que o …



5
Relações entre
Digamos que eu tenha duas matrizes unidimensionais, uma1a1a_1 e uma2a2a_2 . Cada um contém 100 pontos de dados. uma1a1a_1 são os dados reais, e uma2a2a_2 é a previsão do modelo. Nesse caso, o valor de R2R2R^2 seria: R2= 1 - SSr e sSSt o t ( 1 ) .R2=1−SSresSStot (1). …

3
Diferença entre floresta aleatória e árvores extremamente aleatórias
Entendi que Floresta Aleatória e Árvores Extremamente Aleatórias diferem no sentido de que as divisões das árvores na Floresta Aleatória são determinísticas, enquanto que são aleatórias no caso de Árvores Extremamente Aleatórias (para ser mais preciso, a próxima divisão é a melhor divisão entre divisões uniformes aleatórias nas variáveis ​​selecionadas …

9
Qual é a relação entre
Qual é a relação entre YYY e XXX no gráfico a seguir? Na minha opinião, existe um relacionamento linear negativo, mas, como temos muitos discrepantes, o relacionamento é muito fraco. Estou certo? Quero aprender como podemos explicar gráficos de dispersão.

1
Manualmente calculado
Sei que essa é uma Rpergunta bastante específica , mas posso estar pensando na variação proporcional explicada, , incorretamente. Aqui vai.R2R2R^2 Estou tentando usar o Rpacote randomForest. Eu tenho alguns dados de treinamento e dados de teste. Quando encaixo um modelo de floresta aleatório, a randomForestfunção permite inserir novos dados …

1
Por que o teste de Mantel é preferível ao de Moran?
O teste de Mantel é amplamente utilizado em estudos biológicos para examinar a correlação entre a distribuição espacial dos animais (posição no espaço) com, por exemplo, sua relação genética, taxa de agressão ou algum outro atributo. Muitos periódicos bons estão usando ( PNAS, Comportamento Animal, Ecologia Molecular ... ). Eu …

2
O que é simetria composta no inglês comum?
I recentemente realizado que um modelo-misturado com apenas sujeito como um factor aleatório e os outros factores, como factores fixos é equivalente a uma ANOVA quando definindo a estrutura de correlação do modelo misto de simetria composto. Portanto, eu gostaria de saber o que significa simetria composta no contexto de …


3

2
Variação do produto das variáveis ​​dependentes
Qual é a fórmula para variação do produto de variáveis ​​dependentes? No caso de variáveis ​​independentes, a fórmula é simples: var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2var(XY)=E(X2Y2)−E(XY)2=var(X)var(Y)+var(X)E(Y)2+var(Y)E(X)2 {\rm var}(XY) = E(X^{2}Y^{2}) - E(XY)^{2} = {\rm var}(X){\rm var}(Y) + {\rm var}(X)E(Y)^2 + {\rm var}(Y)E(X)^2 Mas qual é a fórmula para variáveis ​​correlacionadas? A propósito, como posso encontrar …

6
Se 'correlação não implica causalidade', se eu encontrar uma correlação estatisticamente significativa, como posso provar a causalidade?
Entendo que correlação não é causalidade . Suponha que obtemos alta correlação entre duas variáveis. Como você verifica se essa correlação é realmente por causa de causalidade? Ou, sob quais condições, exatamente, podemos usar dados experimentais para deduzir uma relação causal entre duas ou mais variáveis?

5
Como lidar com dados hierárquicos / aninhados no aprendizado de máquina
Vou explicar meu problema com um exemplo. Suponha que você queira prever a renda de um indivíduo, com alguns atributos: {Idade, Sexo, País, Região, Cidade}. Você tem um conjunto de dados de treinamento como esse train <- data.frame(CountryID=c(1,1,1,1, 2,2,2,2, 3,3,3,3), RegionID=c(1,1,1,2, 3,3,4,4, 5,5,5,5), CityID=c(1,1,2,3, 4,5,6,6, 7,7,7,8), Age=c(23,48,62,63, 25,41,45,19, 37,41,31,50), Gender=factor(c("M","F","M","F", …
29 regression  machine-learning  multilevel-analysis  correlation  dataset  spatial  paired-comparisons  cross-correlation  clustering  aic  bic  dependent-variable  k-means  mean  standard-error  measurement-error  errors-in-variables  regression  multiple-regression  pca  linear-model  dimensionality-reduction  machine-learning  neural-networks  deep-learning  conv-neural-network  computer-vision  clustering  spss  r  weighted-data  wilcoxon-signed-rank  bayesian  hierarchical-bayesian  bugs  stan  distributions  categorical-data  variance  ecology  r  survival  regression  r-squared  descriptive-statistics  cross-section  maximum-likelihood  factor-analysis  likert  r  multiple-imputation  propensity-scores  distributions  t-test  logit  probit  z-test  confidence-interval  poisson-distribution  deep-learning  conv-neural-network  residual-networks  r  survey  wilcoxon-mann-whitney  ranking  kruskal-wallis  bias  loss-functions  frequentist  decision-theory  risk  machine-learning  distributions  normal-distribution  multivariate-analysis  inference  dataset  factor-analysis  survey  multilevel-analysis  clinical-trials 


Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.