2016 NIPS | Variational Graph Auto-Encoders

Paper：https://arxiv.org/abs/1611.07308
Code： https://github.com/DaehanKim/vgae_pytorch

变分图自动编码器

GAE是GCN在Auto-Encoders (AE)的应用，非常容易理解，隐变量Z就是图上的N个节点经过GCN后的N*F维特征，Encoder就是两层GCN, Decoder就是向量点积。可以将隐变量Z理解为某种意义上图的节点的相似度，通过向量点积得到的两个图节点的相似度越大，则两个节点之间存在边的概率越大。

VGAE是GCN在Variational Graph Auto-Encoders (VAE)的应用。Encoder用两个两层GCN分别得到N个均值和标准差，这两个GCN会共享第一层的参数，从而得到N个正态分布。Decoder仍然是向量点积。

变分图自动编码器（variational graph autoencoder，VGAE），它是基于变分自动编码器（variational auto-encoder，VAE）的无监督学习图结构数据的框架该模型利用了潜在变量，并且有可能学习无向图的可解释潜在表示。

模型

其中， $X$ 为节点的特征矩阵， $A$ 为邻接矩阵，先利用后验概率得到隐变量 $Z$ ，再用隐变量重构邻接矩阵 $A$ 。

确定均值和方差

VGAE 的编码器是一个两层的图卷积网络：
$\prod_{i=1}^{N}q(z_i|X,A)$
其中，后验概率和 VAE 的解决方案一致：
$q(z_i|X,A)=N(z_i|\mu_i, diag(\sigma^2))$
其中， $\mu=GCN_{\mu}(X,A)$ 是特征向量的均值； $log\sigma=GCN_{\sigma}(X,A)$ 是节点向量的方差。

采样

既然已经得到了均值和方差（准确来说应该是均值向量和协方差矩阵），就可以通过采样得到 $Z$ 了，但是，采样操作无法提供梯度信息，也就是说，反向传播在采样操作无法计算梯度，也就无法更新 $W_0$ 和 $W_1$

在 $G A E$ 中，一旦 $GCN$ 中的 $W_0$ 和 $W_1$ 确定了，那么 $GCN$ 就是一个确定的函数，给定 $X$ 和 $A$ ，输出的 $Z$ 就是确定的。

这里有两个要注意的地方，第一个是 $GCN$ 的下标, $GCN_{\mu}$ 和 $GCN_{\sigma}$ 中的 $W_0$
共享但 $W_1$ 是不同的，因此用下标来作区分；第二个是通过 $GCN_{\sigma}$ 得到的是 $log_{\sigma}$ ，这样可以方便后续的计算。

两层卷积神经网络定义为：
$GCN(X,A)=\tilde{A}ReLU(\tilde{A}XW_0)W_1$
其中， $GCN_{\mu}(X,A)$ 和 $GCN_{\sigma}(X,A)$ 共享第一层参数 $W_0$ , 不共享第二层参数 $W_1$ ; $\tilde{A}=D^{-1/2}AD^{-1/2}$ 是对称标准化邻接矩阵。

VGAE 的解码器则是利用隐变量的内积来重构邻接矩阵：
$p(A|Z)=\prod_{i=1}^{N}\prod_{i=1}^{N}p(A_{ij}|z_i,z_j)$
其中， $p(A_{ij}=1|z_i, z_j)=\sigma(z_i^Tz_j)$

损失函数

基本思想与VAE思想相同，这是文中采用的优化目标
损失函数也是包括两部分：
$L=\mathbb{E}_{Z|X,A}[log(A|Z)]-KL(q(Z|X,A)||p(Z))$
其中， $p(Z)=\prod N(z_i|0,I)$ 表示

原文链接：https://blog.csdn.net/weixin_42486623/article/details/126560019