Perguntas com a marcação «clustering»

A análise de cluster é a tarefa de particionar dados em subconjuntos de objetos de acordo com sua "similaridade" mútua, sem usar conhecimento preexistente, como rótulos de classe. [Erros-padrão-cluster e / ou amostras-cluster devem ser marcados como tal; NÃO use a tag "clustering" para eles.]




2
Quais são as distâncias entre variáveis ​​que formam uma matriz de covariância?
Eu tenho uma matriz de covariância e quero particionar variáveis ​​em clusters usando cluster hierárquico (por exemplo, para classificar uma matriz de covariância).kn × nn×nn \times nkkk Existe uma função de distância típica entre variáveis ​​(ou seja, entre colunas / linhas da matriz de covariância quadrada)? Ou, se houver mais, …





1
R / mgcv: Por que os produtos tensores te () e ti () produzem superfícies diferentes?
O mgcvpacote para Rpossui duas funções para ajustar as interações do produto tensorial: te()e ti(). Entendo a divisão básica do trabalho entre os dois (ajustando uma interação não linear versus decompondo essa interação em efeitos principais e uma interação). O que não entendo é o porquê te(x1, x2)e ti(x1) + …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 


1
Atribuir pesos a variáveis ​​na análise de cluster
Quero atribuir pesos diferentes às variáveis ​​em minha análise de cluster, mas meu programa (Stata) parece não ter uma opção para isso, então preciso fazê-lo manualmente. Imagine 4 variáveis ​​A, B, C, D. Os pesos para essas variáveis ​​devem ser w(A)=50% w(B)=25% w(C)=10% w(D)=15% Eu estou querendo saber se uma …
11 clustering  stata 




4
Como você testa uma implementação de k-means?
Isenção de responsabilidade: postei esta pergunta no Stackoverflow, mas achei que talvez isso seja mais adequado para esta plataforma. Como você testa sua própria implementação de k-means para conjuntos de dados multidimensionais? Eu estava pensando em executar uma implementação já existente (ou seja, Matlab) nos dados e comparar os resultados …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.