Intuição por trás dos autovalores de uma matriz de adjacência


10

Atualmente, estou trabalhando para entender o uso do limite de Cheeger e da desigualdade de Cheeger, e seu uso para particionamento espectral, condutância, expansão, etc., mas ainda luto para iniciar uma intuição sobre o segundo autovalor da matriz de adjacência.
Geralmente, na teoria dos grafos, a maioria dos conceitos que encontramos é bastante simples de intuir, mas, neste caso, não consigo nem imaginar que tipo de gráfico teria um segundo valor próprio muito baixo ou muito alto.
Eu tenho lido perguntas semelhantes aqui e ali na rede SE, mas elas geralmente se referem a valores próprios em diferentes campos ( análise multivariada , matrizes de distância euclidiana , matrizes de correlação ...).
Mas nada sobre particionamento espectral e teoria de grafos.

Alguém pode tentar compartilhar sua intuição / experiência desse segundo autovalor no caso de gráficos e matrizes de adjacência?


Você está familiarizado com a conexão entre o espectro da matriz de adjacência e a convergência de passeios aleatórios no gráfico?
Yuval Filmus

@YuvalFilmus De maneira alguma, apesar de estar realmente familiarizado com passeios aleatórios e de alguma forma familiarizado com o espectro de uma matriz de adjacência. Então, eu estou interessado na sua opinião, na verdade :)
m.raynal

Respostas:


6

O segundo autovalor (em magnitude) controla a taxa de convergência da caminhada aleatória no gráfico. Isso é explicado em muitas notas de aula, por exemplo, notas de Luca Trevisan . Grosso modo, a distância L2 à uniformidade após t etapas pode ser limitada por λ2t .

Outro local onde o segundo autovalor aparece é o problema da camarilha plantada . O ponto de partida é a observação de que um aleatória G(n,1/2) gráfico contém um clique de tamanho 2log2n , mas o algoritmo ávido encontra somente um clique de tamanho log2n , e não há melhor algoritmo eficiente é conhecido. (O algoritmo ganancioso apenas escolhe um nó aleatório, joga fora todos os não vizinhos e repete.)

Isto sugere plantando uma grande facção no topo de G(n,1/2) . A questão é: qual deve ser o tamanho da camarilha, para que possamos encontrá-la com eficiência. Se plantarmos uma camarilha do tamanho Cnlogn , poderíamos identificar os vértices da camarilha apenas pelo seu grau; mas esse método funciona apenas para panelinhas de tamanhoΩ(nlogn). Podemos melhorar isso usando técnicas espectrais: se plantarmos um clique do tamanhoCn , osegundo vetor própriocodifica a camarilha, comoAlon, Krivelevich e Sudakovmostraram em um artigo clássico.

De maneira mais geral, os primeiros autovetores são úteis para particionar o gráfico em um pequeno número de clusters. Veja, por exemplo, o Capítulo 3 das notas de aula de Luca Trevisan , que descreve as desigualdades de ordem superior de Cheeger.


5

(Isenção de responsabilidade: esta resposta é sobre autovalores de gráficos em geral, não o segundo autovalor em particular. Espero que seja útil, no entanto.)

Uma maneira interessante de pensar sobre os autovalores de um gráfico G=(V,E) é pegar o espaço vetorial Rn onde n=|V|e identificando cada vetor com uma função f:VR (isto é, uma marcação de vértice). Um vetor próprio da matriz de adjacência, então, é um elemento de fRn tal que existe λR (isto é, um valor próprio) com Af=λf , Asendo a matriz de adjacência de G . Observe que Af é o vetor associado ao mapa que envia todos os vértices vV para uN(v)f(u) , sendo N(v) o conjunto de vizinhos (ou seja, vértices adjacentes a) u . Portanto, nessa configuração, a propriedade de autovetor de f corresponde à propriedade que soma os valores da função (em f )dos vizinhos de um vértice produz o mesmo resultado da multiplicação do valor da função do vértice pela constante λ .


Muito obrigado, eu nunca 'vi' que o vetor próprio multiplicado por \ lambda tinha o valor da soma dos valores de função dos vizinhos (mesmo que seja diretamente da definição).
m.raynal

11
Eu também :) Encontrei-o por acaso em um plano de estudos sobre autovalores de gráficos.
Dkaeae 28/05/19

5

G

GdGL=I1dAIn×nAf:VR,L

f,Lf=1d(u,v)E(f(u)f(v))2.

AdL0λ2AL1λ2d

1λ2d=min{f,Lff,f:vVf(v)=0,f0}.

f,Lfff:VRf0f0(u)=f(u)1nvVf(v)

1λ2d=min{f,Lff0,f0:f not constant}.

Agora, um pouco de cálculo mostra que , e substituindo acima e dividindo numerador e denominador por , temosf0,f0=1n{u,v}(V2)(f(u)f(v))2n2

1λ2d=min{2nd(u,v)E(f(u)f(v))22n2{u,v}(V2)(f(u)f(v))2:f not constant}.

O que isso significa é que, se colocarmos todos os vértices de na linha real no ponto , a distância média entre dois vértices aleatórios independentes no gráfico (o denominador) será no máximo vezes a distância média entre os pontos finais de uma aresta aleatória no gráfico (o numerador). Portanto, nesse sentido, uma grande lacuna espectral significa que o que acontece através de uma borda aleatória de (comportamento local) é um bom preditor para o que acontece através de um par aleatório não correlacionado de vértices (comportamento global).uGf(u)ddλ2G

Ao utilizar nosso site, você reconhece que leu e compreendeu nossa Política de Cookies e nossa Política de Privacidade.
Licensed under cc by-sa 3.0 with attribution required.