← 返回列表

一种图像识别方法、装置和电子设备

申请号: CN201810574220.3
申请人: 北京搜狗科技发展有限公司
申请日期: 2018年6月6日

摘要文本

本发明实施例提供了一种图像识别方法、装置和电子设备,其中,所述方法包括:获取原始图像,采用全卷积神经网络提取所述原始图像的特征得到特征图像,确定所述特征图像的连通域,依据连通域的像素点坐标确定原始图像的文本检测区域,依据所述文本检测区域确定文本信息,并显示所述文本信息;进而本发明实施例通过采用全卷积神经网络对原始图像进行像素分割,以及对像素分割得到的特征图像进行图像处理,来确定原始图像的文本检测区域,提高了确定文本检测区域的准确性和效率,从而能够高效识别图像中各种角度的文本。

专利详细信息

项目 内容
专利名称 一种图像识别方法、装置和电子设备
专利类型 发明授权
申请号 CN201810574220.3
申请日 2018年6月6日
公告号 CN110569835B
公开日 2024年3月5日
IPC主分类号 G06V30/146
权利人 北京搜狗科技发展有限公司
发明人 徐露露
地址 北京市海淀区中关村东路1号院9号楼搜狐网络大厦9层01房间

专利主权项内容

1.一种图像识别方法,其特征在于,包括:获取原始图像,采用全卷积神经网络提取所述原始图像的特征得到特征图像;所述全卷积神经网络在训练的过程中,缩小了训练图像对应的标签图像的标注区域;确定所述特征图像的连通域,并依据所述连通域的像素点坐标,确定所述连通域的外接多边形和外接多边形各个顶点的像素点坐标;依据设定条件更新各个顶点的像素点坐标,以放大由所述顶点组成的多边形面积;在原始图像中分别确定更新像素点坐标后各顶点对应的像素点;确定以各个像素点为顶点的多边形区域,将所述多边形区域确定为所述原始图像的文本检测区域;依据所述文本检测区域确定文本信息,并显示所述文本信息。