OCR之表格结构识别综述

引言

  • 因为最近在做表格识别这块,顺道整理了一下都有哪些方法。

特定数据集上效果排行榜

ICDAR 2021 Task B

团队算法介绍TEDS all开源地址
海康威视 Davar-LabLGPMA: Complicated Table Structure Recognition with Local and Global Pyramid Mask Alignment96.36LGPMA
平安科技PingAn-VCGroup’s Solution for ICDAR 2021Competition on Scientific Literature Parsing Task B:Table Recognition to HTML96.32TableMASTER

综述文章


传统方法

自顶向下(先检测表格区域,再不断对表格区域进行切割拆分得到单元格区域)
  • OpenCV检测并提取表格:图像二值化→霍夫变换,检测直线→找到表格
自底向上(先检测文本块,找到可能的表格线以及这些线的交点,确定单元格后还原出表格区域)

深度学习方法

语义分割
目标检测
序列预测
图神经

参考资料


版权声明:本文为shiwanghualuo原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。