第一节Pytorch_BERT_CASREL关系抽取模型学习记录

一、关系识别的三种场景

其中Normal表示三元组之间没有重叠

EPO表示两个实体有两个完全不同的关系的 情形

SEO表示一个实体参与到了多个关系情形

二、该模型达到的最终效果

 三、CasRel模型结构预览

 

四、关系抽取模型类型

Pipeline和joint Model 

五、模型地址

论文名称:CASREL:A Novel Cascade Binary Tagging Framework for Relational Triple Extraction

代码地址:weizhepei/CasRel: A Novel Cascade Binary Tagging Framework for Relational Triple Extraction. Accepted by ACL 2020. (github.com)

六、模型局限性

1.无法解决实体嵌套问题,因为实体是就近匹配

2.该模型不适用于长段落或者跨篇章,位于bert编码为512位

3.只能应用于垂直领域,大白话就是每个项目需要特定的关系,不能实现开放抽取

七、数据准备

bert模型地址:bert-base-chinese · Hugging Face

下载好后的文件结构如下图所示:

关系数据地址:千言(LUGE)| 全面的中文开源数据集合 

选择DUIE2.0中文关系抽取数据集

 形成以下目录结构:

 


版权声明:本文为u013373155原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。