A melhor maneira de agrupar uma matriz de adjacência


8

Foi difícil interpretar clusters resultantes de uma matriz de adjacência. Eu tenho 200 matrizes relativamente grandes que representam assuntos que contêm correlações parciais (escores z) de séries temporais (dados neurais). O objetivo é agrupar essas 210 matrizes e detectar possíveis comunidades não descobertas. Fiz outros cálculos de correlação parcial, resultando na matriz de adjacência de 200x200. Sempre que executo um algoritmo de detecção de comunidade (por exemplo, o de Newmann), ele aparece com comunidades dificilmente interpretáveis.

A questão é: que tipo de testes estatísticos dirão se essas comunidades ou grupos são significativos? e se sim, existem maneiras sistemáticas de elaborar a interpretação?


Tanto quanto sei, não existe um "caminho certo" único para fazer isso. Uma abordagem seria usar algo como cluster hierárquico na matriz de distância onde ρ são as correlações. A outra coisa é se sua última matriz de correlação capturará relacionamentos significativos. Que medidas foram tomadas para produzi-lo? 1|ρ|ρ
conjectures

Obrigado. Com relação à sua pergunta, o que eu fiz foi correlacionar todas as linhas (ou dados do sujeito) com todos os outros assuntos usando corrcoef (correlação simples) e foi assim que obtive os resultados. Estou tentando detectar os padrões e é por isso que tive que me correlacionar novamente.
Fahd

no PO, sugere-se que os dados do sujeito sejam avaliados com matriz; como isso se torna uma única linha por sujeito?
conjectures

Respostas:


2

Eu fiz alguns trabalhos no passado sobre agrupamento espectral que podem ser úteis aqui. A idéia básica é que se possa usar a matriz de adjacência para formar a chamada matriz de Laplacian:

L=ID1/2AD1/2

(B1,B2)


2

Eu estou olhando para o mesmo problema no momento. Da análise rápida, parece que o agrupamento espectral é a maneira mais "natural" de analisar uma matriz de adjacência. Veja esta postagem do blog para mais detalhes.


0

Como alternativa ... Dados neurais (reais ou artificiais) geralmente são uma representação altamente compactada dos dados, o que significa que os dados são muito aleatórios, o que significa que você não encontrará correlações. Qual você tem !! Parabéns! :)

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.