NER-序列标注

命名实体识别-序列标注

标签类型

进行命名实体识别时,通常对每个字进行标注。中文为单个字,英文为单词,空格分割。
标签类型一般如下:

类型说明
BBegin,代表实体片段的开始
IInternediate,代表实体片段的中间
EEnd,代表实体片段的结束
SSingle,代表实体片段为单个字
OOther,代表字符不为任何实体

标注类型

这里介绍比较常用的几种标注方式
BIO:标识实体的开始,中间部分和非实体部分
BIOS:增加S单个实体情况的标注
BIOSE:增加E实体的结束标识

标注demo

BIO标注&&BIOSE标注

BIO标注BIO标注

版权声明:本文为wang735019原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。