← 返回列表
基于机器视觉的甲骨文识别方法及其系统
摘要文本
本发明公开了基于机器视觉的甲骨文识别方法及其系统,方法包括数据采集、数据预处理、图像增强、建立甲骨文识别模型和甲骨文识别。本发明属于文字识别技术领域,具体是指基于机器视觉的甲骨文识别方法及其系统,本方案建立双U‑Net模型,分别完成去噪过程中噪声的预测和数据分布的变换,在上采样阶段将相应位置的特征图进行通道连接,使用组归一化代替批量归一化操作,在骨干层和下采样层的每个残差块之后都使用了Dropout层;建立的模型每个空间核在两个独立的分支中独立地卷积输入图像,通过生成的特征图中的神经元直接捕获两个相距很远的像素之间的相关性,通过特征组合和底部分支处理,提取全局时空特征。
申请人信息
- 申请人:微山同在电子信息科技有限公司
- 申请人地址:272000 山东省济宁市微山县欢城镇微欢路欢城计生办206室
- 发明人: 微山同在电子信息科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于机器视觉的甲骨文识别方法及其系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410233869.4 |
| 申请日 | 2024/3/1 |
| 公告号 | CN117809318A |
| 公开日 | 2024/4/2 |
| IPC主分类号 | G06V30/22 |
| 权利人 | 微山同在电子信息科技有限公司 |
| 发明人 | 洪鑫亮 |
| 地址 | 山东省济宁市微山县欢城镇微欢路欢城计生办206室 |
专利主权项内容
1.基于机器视觉的甲骨文识别方法,其特征在于:该方法包括以下步骤:步骤S1:数据采集, 采集甲骨文图像数据集;步骤S2:数据预处理, 对采集的图像进行数据集标注和划分数据集;步骤S3:图像增强, 建立双U-Net模型,分别完成去噪过程中噪声的预测和数据分布的变换;模型在经历了五次下采样后,将输入图像的大小从256×256转换为8×8;下采样过程中,使用残差模块来提取输入图像的特征信息,并在上采样阶段将相应位置的特征图进行通道拼接;主干层中包含两个残差块,每个残差块包含一个单步卷积层;在图像恢复过程中,使用了五个上采样步骤逐渐完成;模型使用了分组归一化;此外,在主干层和下采样层的每个残差块之后,使用了Dropout层;步骤S4:建立甲骨文识别模型, 通过特征组合和底部分支处理,提取全局时空特征,以此构建甲骨文识别模型;步骤S5:甲骨文识别, 利用训练完成的甲骨文识别模型, 模型输出甲骨文所属类别。