Perguntas com a marcação «compositional-data»


1
Quais são algumas das distribuições sobre a probabilidade simplex?
Seja a probabilidade simplex da dimensão , ou seja, é tal que e .ΔKΔK\Delta_{K}K- 1K-1K-1x ∈ ΔKx∈ΔKx \in \Delta_{K}xEu≥ 0xEu≥0 0x_i \ge 0∑EuxEu= 1∑EuxEu=1\sum_i x_i = 1 Quais distribuições que são frequentemente (ou conhecidas ou definidas no passado) sobre existem?ΔKΔK\Delta_{K} Claramente, existem as distribuições Dirichlet e Logit-Normal. Existem outras distribuições …


3
Preciso descartar variáveis ​​correlacionadas / colineares antes de executar kmeans?
Estou executando kmeans para identificar grupos de clientes. Eu tenho aproximadamente 100 variáveis ​​para identificar clusters. Cada uma dessas variáveis ​​representa a% de gasto de um cliente em uma categoria. Portanto, se eu tiver 100 categorias, tenho essas 100 variáveis, de modo que a soma dessas variáveis ​​seja 100% para …

2
Agrupamento de dados muito distorcidos e contados: alguma sugestão a ser feita (transformar etc)?
Problema básico Aqui está o meu problema básico: estou tentando agrupar um conjunto de dados que contém algumas variáveis ​​muito assimétricas com contagens. As variáveis ​​contêm muitos zeros e, portanto, não são muito informativas para o meu procedimento de agrupamento - o que provavelmente é um algoritmo k-means. Tudo bem, …



1
Problemas com a previsão de séries temporais
Eu tenho uma pergunta sobre modelagem de séries temporais em R. meus dados consistem na seguinte matriz: 1 0.03333333 0.01111111 0.9555556 2 0.03810624 0.02309469 0.9387991 3 0.00000000 0.03846154 0.9615385 4 0.03776683 0.03119869 0.9310345 5 0.06606607 0.01201201 0.9219219 6 0.03900325 0.02058505 0.9404117 7 0.03125000 0.01562500 0.9531250 8 0.00000000 0.00000000 1.0000000 9 …

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.