Deepwalk(深度游走)算法简介

深度游走:一种社交表示的在线学习算法

主要思想

Deepwalk是一种将随机游走(random walk)和word2vec两种算法相结合的图结构数据挖掘算法。该算法能够学习网络的隐藏信息,能够将图中的节点表示为一个包含潜在信息的向量,如图1-2所示。
在这里插入图片描述

图1 输入: 图信号

在这里插入图片描述

图2 输出: 图节点嵌入

Deepwalk算法

该算法主要分为随机游走和生成表示向量两个部分。首先利用随机游走算法(Random walk)从图中提取一些顶点序列;然后借助自然语言处理的思路,将生成的定点序列看作由单词组成的句子,所有的序列可以看作一个大的语料库(corpus),最有利用自然语言处理工具word2vec将每一个顶点表示为一个维度为d的向量。

  1. 符号定义:一个图可以表示为:
    G = ( V , E ) G = (V,E)G=(V,E)其中,V VV表示顶点的集合;E EE表示边的集合, 且 E ⊆ V × V E \subseteq V \times VEV×V
  2. 算法:
算法1: D e e p W a l k ( G , w , d , γ , t ) DeepWalk(G, w, d, γ, t)DeepWalk(G,w,d,γ,t)
输入:图G ( V , E ) G(V, E)G(V,E)
窗口尺寸 w ww
输出维度 d dd
以每个节点开始的路径数量 γ γγ
每条路径的长度 t tt
输出:隐含信息的表示矩阵Φ ∈ R ∣ V ∣ × d \Phi \in \textbf R^{\vert V \vert} \times dΦRV×d
1. 随机初始化Ф ФФ
2: for i = 0 i=0i=0 to γ γγ do
3: 将顶点随机排列,即O = S h u f f l e ( V ) O=Shuffle(V)O=Shuffle(V)
4: for 每一个v i ∈ O vi∈OviO do:
5: W v i = R a n d o m W a l k ( G , v i , t ) W_{v_i} = RandomWalk(G, v_i, t)Wvi=RandomWalk(G,vi,t)
6. W o r d 2 v e c ( Ф , W v i , w ) Word2vec(Ф, W_{v_i}, w)Word2vec(Ф,Wvi,w)
7. end for
8. end for

参考文献

[1] Perozzi B, Al-Rfou R, Skiena S. DeepWalk: Online Learning of Social Representations[C]. Proceedings of the 20th ACM SIGKDD international conference on Knowledge discovery and data mining - KDD '14, 2014: 701-710.


版权声明:本文为qq_42570717原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。