SIGIR2019|胶囊网络来解释你喜欢什么不喜欢什么(已开源)

A Capsule Network for Recommendation and Explaining What You Like and Dislike

Chenliang Li, Cong Quan, Li Peng, Yunwei Qi, Yuming Deng, Libing Wu

Wuhan University, Alibaba Group

https://arxiv.org/pdf/1907.00687.pdf

用户评论中包含了丰富的语义信息,从这些信息中可以推断用户对商品的各个属性的偏好。目前为止,已经有很多基于深度学习的方法对用户评论进行探索,进而用于推荐系统。这些方法中的注意力机制主要用于识别对评价预测比较重要的单词或者商品的属性。

但是,如果不利用评论详情,仅根据用户的视角以及对应的程度很难判断用户对某个属性喜欢还是不喜欢。作者们将用户观点和商品属性对作为一个逻辑单元。根据评论挖掘有价值的逻辑单元进而对评价进行解释,并且将对应的观点解析出来有利于更好地预测评分,同时具有一定的可解释性。

为此,作者们提出一种基于胶囊网络的模型基于用户评论来预测评分,该模型简称CARP。针对每个用户-商品对,CARP能够根据评论抽取有价值的逻辑单元,同时推断相应的情感。

该模型首先从用户对商品的评论中提取视角和态度,然后基于视角和态度来推导每个逻辑单元的表示。利用双向一致路由协议提出了一种新的情感胶囊网络结构,它可以识别有价值的逻辑单元,还可以提取用户商品层面的基于情感的表示,进而用于评分预测。

本文在7个真实数据集上进行了大量实验,这些数据集的特性各异。结果表明本文方法相对近期的sota模型在准确率方面具有很大提升。进一步分析表明,该模型能够在更精细的粒度上成功发现具有可解释性的原因。

亚马逊上的用户评论示例如下

本文所提出的CARP由两部分构成

其中情感胶囊网络包含两个胶囊网络,积极胶囊网络和消极胶囊网络,无需人工打标签,也无需额外的nlp工具

本文的主要贡献如下

本文方法相对之前方法的优势在于

CARP的网络结构图示如下

其中上下文编码描述如下

逻辑单元的定义如下

情感胶囊网络构成及表示如下

现有路由协议的缺陷在于

算法流程如下

双一致算法伪代码如下

其中式5为

预测函数形式如下

多任务学习目标函数定义如下

为了解决数据不平衡问题(具体表现为正样本远多于负样本),上述函数需要改造

数据集准备时的配置及特殊处理如下

对比的算法有以下几个

超参数设置如下

数据集统计信息如下

其中density计算方式为#ratings/#users/#items

几种方法的效果(MSE)对比如下

其中PMF对应的论文为

Probabilistic Matrix Factorization, NIPS 2007

代码地址

https://github.com/fuhailin/Probabilistic-Matrix-Factorization

RBLT对应的论文为

Rating-Boosted Latent Topics: Understanding Users and Items with Ratings and Reviews, IJCAI 2016

CMLE对应的论文为

Collaborative Multi-Level Embedding Learning from Reviews for Rating Prediction, IJCAI 2016

DeepCoNN对应的论文为

Joint Deep Modeling of Users and Items Using Reviews for Recommendation, WSDM 2017

代码地址

https://github.com/chenchongthu/DeepCoNN

D-Attn对应的论文为

Interpretable Convolutional Neural Networks with Dual Local and Global Attention for Review Rating Prediction, Recsys 2017

代码地址

https://github.com/seongjunyun/CNN-with-Dual-Local-and-Global-Attention

TransNet对应的论文为

TransNets: Learning to Transform for Recommendation, Recsys 2017

代码地址

https://github.com/rosecatherinek/TransNets

TARMF对应的论文为

Coevolutionary Recommendation Model: Mutual Learning between Ratings and Reviews, WWW 2018

MPCN对应的论文为

Multi-Pointer Co-Attention Networks for Recommendation, KDD 2018

代码地址

https://github.com/vanzytay/KDD2018_MPCN

ANR对应的论文为

ANR: Aspect-based Neural Recommender, CIKM 2018

代码地址

https://github.com/almightyGOSU/ANR

CARP-RA中RA源于

Dynamic Routing Between Capsules NIPS 2017

代码地址

https://github.com/adambielski/CapsNet-pytorch

不同位次下比例(正负之比)以及不同的λ的影响图示如下

不同个数的视角/方面下CARP的效果对比如下

不同迭代次数对RBiA的影响如下

代码地址

https://github.com/WHUIR/CARP


              我是分割线


您可能感兴趣

KDD2018|基于GBM的动态定价回归模型

KDD2018|超越deepfm的CTR预估模型深层兴趣网络DIN(已开源)

RecSys2019|优于DeepFM和XDeepFM的CTR模型FiBiNET

SIGIR2018|选择性GBDT(SelGB)用于排序学习(已开源)

AAAI2018|斯坦福大学提出并开源增强生成式模型

ijcai2017|CTR经典模型DeepFM,FNN,PNN,W&D,LR,FM对比(哈工大诺亚方舟提出CTR模型)

ICML2019|一种基于强化学习的推荐系统(GAN用户模型,佐治亚理工学院联合蚂蚁金服提出且已开源)

ICML2018|GBDT中如何寻找影响较大样本(普林斯顿大学联合Yandex提出并开源)

IJCAI2019|基于对抗变分自编码的协同过滤框架VAEGAN

聊聊CatBoost

聊聊XGBoost CatBoost LightGBM RF GBDT

IJCAI2019|新型特征增广GBDT--AugBoost(已开源)

IJCAI2019|清华大学提出并开源新型梯度提升决策树(梯度提升分段线性回归树)

新型梯度提升决策树GBDT-SPARSE(谷歌微软FaceBook加州大学联合提出)

ICML2019|深度学习鼻祖之一Bengio提出并开源图马尔科夫神经网络

GBDT,LR,深度学习如何联合发力(以推荐系统和游戏为例)

大规模GBDT系统应用场景及效果对比(LightGBM,XgBoost,DimBoost等)

新型在线预测模型DeepGBM(基于GBDT扩展的深度学习框架)

顶会中深度学习用于CTR预估的论文及代码集锦 (3)

NIPS2018深度学习(9)|亮点:多元卷积稀疏编码、循环关系网络

ICML 2018 深度学习论文及代码集锦(5)

深度学习用于文本摘要的论文及代码集锦

深度学习用于机器翻译的论文及代码集锦

深度学习用于序列标注中的论文及代码集锦

深度学习在推荐系统中的应用及代码集锦(4)

深度学习在OCR中的应用论文及代码集锦 (2)


版权声明:本文为hestendelin原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。