← 返回列表

图像中表格信息的识别方法、装置、电子设备及存储介质

申请号: CN202110112546.6
申请人: 北京金山数字娱乐科技有限公司; 成都金山互动娱乐科技有限公司
申请日期: 2018年12月13日

摘要文本

本发明实施例提供了一种图像中表格信息的识别方法、装置、电子设备及存储介质,所述方法包括:接收具有表格的目标图像;从目标图像中确定包含表格的表格图像;对表格图像进行文本行检测,确定表格图像中文本行的位置;根据文本行的位置对表格图像进行识别,得到表格图像的表格信息,其中,所述表格信息包括文字信息及表格结构信息。由于识别得到的表格信息包括文字信息及表格结构信息,而不仅仅是表格中的文字内容,因此提高了图像中的表格识别结果的多样性,利用后续进行表格恢复等进一步处理。

专利详细信息

项目 内容
专利名称 图像中表格信息的识别方法、装置、电子设备及存储介质
专利类型 发明授权
申请号 CN202110112546.6
申请日 2018年12月13日
公告号 CN112818812B
公开日 2024年3月12日
IPC主分类号 G06V30/412
权利人 北京金山数字娱乐科技有限公司; 成都金山互动娱乐科技有限公司
发明人 郑磊波; 王洪伟; 刘天悦
地址 北京市海淀区小营西路33号金山软件大厦2层西区; 四川省成都市高新区天府大道南沿线成都高新孵化园科技财富中心3层

专利主权项内容

1.一种图像中表格信息的识别方法,其特征在于,所述方法包括:接收具有表格的目标图像;从所述目标图像中确定包含表格的表格图像;对所述表格图像进行文本行检测,确定所述表格图像中文本行的位置;去除所述表格图像的表格线;根据所述文本行的位置,从去除表格线后的表格图像中分割出文本图像;对所述分割出的文本图像进行识别,得到所述表格图像的文字信息;基于所述表格图像中文本行的位置,去除所述表格图像中的字符;确定去除字符后的表格图像中交点数量及封闭单元格的数量;根据所述表格线的交点数量确定所述表格的单元格数量;基于所述封闭单元格的数量与所述单元格数量,确定所述表格图像的表格线是否完整;如果所述表格图像的表格线不完整,将所述表格图像的表格线补全;对表格线完整的表格图像进行表格识别,得到所述表格图像的表格结构信息。