GCN——意识流理解

之前看GCN(Graph Convolutional Network)的时候总是一知半解、懵懵懂懂。在学习了GAT和GIN并深入阅读了源码后终于对GCN有了更进一步的了解。

意识流理解GCN

第一步：平均

这里我们可以同通过收集并平均你的neighbor的信息来提取信息：
$aggregatre(X_i)=\sum_{j\in{neighbor(i)}}A_{ij}X_{j}$

第二步：加权平均

考虑到不同neighbor之间的重要性：
$a g g r e g a t r e (X) = A X$
这里我们将无权图改为有权图即可。

第三步：考虑自身因素

聚类一个Graph的时候往往要考虑自身feature的因素，所以，这里我们用一个单位矩阵实现：
$a g g r e g a t r e (X) = (A + I) X = A X + X =$
$aggregatre(X_i)=\sum_{j\in{neighbor(i)}}A_{ij}X_{j}+X_i$
通过展开式我们能够看出加上了自身的特征

第四步：差分

这里我们使用度矩阵 $D$ 与邻接矩阵 $A$ 做差分：
$d i f f (X) = (D - A) X$

第五步：归一化与对称归一化

这里我们令 $\hat{A}=A+I$ ， $\hat{D}$ 为 $\hat{A}=A+I$ 的度矩阵。通过 $\hat{D}^{-1}$ 能够将求和变为加权平均（意识流理解，有空再写详细证明）。于是我们能够得到最终的GCN传播方式
$H^{(l+1)}=\sigma(\hat{D}^{-1/2}\hat{A}\hat{D}^{-1/2}H^{l}W^{(l)})$
其中， $\sigma$ 为非线性激活函数。

pyhton的代码实现为：

    def _call(self, inputs):
        x = inputs
        x = tf.nn.dropout(x, 1 - self.dropout)
        x = tf.matmul(x, self.vars['weights'])
        x = tf.sparse_tensor_dense_matmul(self.adj, x)
        outputs = self.act(x)
        return outputs

注：之前就疑惑为什么传播公式里面的 $\hat{D}$ 为什么不体现在code中，原来是因为数据集的不同， $\hat{D}^{-1/2}\hat{A}\hat{D}^{-1/2}$ 往往计算在内，这里的code只是书写形式罢辽。

读到这里，我也就能够明白为什么论文“HOW POWERFUL ARE GRAPH NEURAL NETWORKS?”中阐述GCN中AGGREGATE金额COMBINE步骤时用来MEAN来表示：

在这里插入图片描述

灵感来源

链接: 知乎大神：纵横.

原文链接：https://blog.csdn.net/m0_38140207/article/details/106151872