← 返回列表
一种文本识别方法及装置
摘要文本
本申请实施例提供了一种文本识别方法和装置,其中所述方法包括获取图像样本的位置信息,根据位置信息,生成图像样本的图像特征,基于图像样本以及对应标记的文本数据,创建基于图像特征识别图像中文本的识别数据集合,基于识别数据集合识别目标图像,获得目标文本,使得在训练模型时,将位置信息提供到模型中来生成图像特征,引导训练时模型的注意力,通过位置信息来指导、优化其他图像特征的训练学习过程,使得训练更有针对性,提高训练速度,并在识别图像中文本时取得更高的识别准确率。
申请人信息
- 申请人:北京搜狗科技发展有限公司
- 申请人地址:100084 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间
- 发明人: 北京搜狗科技发展有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种文本识别方法及装置 |
| 专利类型 | 发明授权 |
| 申请号 | CN201810636441.9 |
| 申请日 | 2018年6月20日 |
| 公告号 | CN110619325B |
| 公开日 | 2024年3月8日 |
| IPC主分类号 | G06V30/14 |
| 权利人 | 北京搜狗科技发展有限公司 |
| 发明人 | 王子豪; 马龙 |
| 地址 | 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间 |
专利主权项内容
1.一种文本识别方法,其特征在于,包括:根据预设卷积参数对图像样本进行特征提取,得到所述图像样本中划分的各个区域对应的第一特征点;根据所述各个区域的位置关系,由所述第一特征点组成包含位置信息的第一特征图;利用卷积神经网络对所述图像样本进行特征提取,得到预设层数的第二特征图;结合所述第一特征图和至少一层第二特征图,得到第三特征图;基于所述图像样本以及对应标记的文本数据,创建基于图像特征识别图像中文本的识别数据集合;基于所述识别数据集合识别目标图像,获得目标文本。