Recentemente me deparei com a incorporação de gráficos, como o DeepWalk e o LINE. No entanto, ainda não tenho uma ideia clara do significado de incorporação de gráficos e quando usá-lo (aplicativos)? Todas as sugestões são bem-vindas!
Recentemente me deparei com a incorporação de gráficos, como o DeepWalk e o LINE. No entanto, ainda não tenho uma ideia clara do significado de incorporação de gráficos e quando usá-lo (aplicativos)? Todas as sugestões são bem-vindas!
Respostas:
A incorporação de gráfico aprende um mapeamento de uma rede para um espaço vetorial, preservando as propriedades relevantes da rede.
Os espaços vetoriais são mais acessíveis à ciência de dados do que aos gráficos. Os gráficos contêm arestas e nós; esses relacionamentos de rede podem usar apenas um subconjunto específico de matemática, estatística e aprendizado de máquina. Os espaços vetoriais têm um conjunto de ferramentas mais rico desses domínios. Além disso, as operações vetoriais são geralmente mais simples e rápidas que as operações gráficas equivalentes.
Um exemplo é encontrar vizinhos mais próximos. Você pode executar "saltos" de nó para outro nó em um gráfico. Em muitos gráficos do mundo real após alguns saltos, há pouca informação significativa (por exemplo, recomendações de amigos de amigos de amigos). No entanto, em espaços vetoriais, você pode usar métricas de distância para obter resultados quantitativos (por exemplo, distância euclidiana ou semelhança cosseno). Se você possui métricas quantitativas de distância em um espaço vetorial significativo, é fácil encontrar vizinhos mais próximos.
" Técnicas de incorporação de gráficos, aplicativos e desempenho: uma pesquisa " é um artigo de visão geral que entra em mais detalhes.
O que são Embeddings gráficos? "Graph Embeddings" é uma área quente hoje em aprendizado de máquina. Basicamente, significa encontrar "representação vetorial latente" de gráficos que captura a topologia (no sentido muito básico) do gráfico. Podemos enriquecer essa "representação vetorial", considerando também as relações vértice-vértice, informações de arestas, etc. subgráficos de vários tamanhos):
Aplicativos - Observando atentamente, os incorporamentos são representações "latentes", o que significa que se um gráfico tiver | V | * | V | matriz de adjacência onde | V | = 1M, é difícil usar ou processar números de 1M * 1M em um algoritmo. Portanto, a incorporação latente da dimensão 'd', em que d << | V |, tornaria a matriz de adjacência | V | * de relativamente fácil de usar. Outra aplicação pode ser: considere um cenário simples em que queremos recomendar produtos para pessoas que têm interesses semelhantes em uma rede social. Com a incorporação de vértices (aqui significa representação vetorial de cada pessoa), podemos encontrar os semelhantes plotando esses vetores e isso facilita as recomendações. Estas são algumas aplicações e outras. Você pode consultar um bom documento de pesquisa - Graph Embedding Techniques, uma Pesquisa .
De onde veio tudo isso? Existem muitos trabalhos nessa área e quase todos vêm da pesquisa inovadora no campo do processamento de linguagem natural - "Word2Vec", de Mikolov. Se você deseja iniciar a pesquisa sobre incorporação de gráficos, eu recomendo que primeiro entenda como o Word2Vec funciona. Você pode encontrar explicações interessantes - o aprendizado de parâmetros do Word2Vec é explicado e a Stanford Lecture . Depois, você pode pular para os papéis que listou. Esses trabalhos podem ser classificados como:
Trabalhos baseados em "Vertex Embeddings": - DeepWalk , Node2Vec , LINE .
Trabalhos baseados em " Embutimentos de gráfico": - Deep Graph Kernels , Subgraph2Vec .
No artigo Um teorema do limite central para uma incorporação omnibus de gráficos de produtos de pontos aleatórios por Levin et.al. papel, um tipo específico de incorporação de gráfico (a incorporação Omnibus) define a incorporação de gráfico como uma metodologia "na qual os vértices de um gráfico são mapeados para vetores em um espaço euclidiano de baixa dimensão". Verifique o link para mais informações.