← 返回列表

一种基于机器学习的数据处理与识别模型的训练方法

申请号: CN202410205784.5
申请人: 聊城莱柯智能机器人有限公司; 数炬(山东)智能科技有限公司
申请日期: 2024/2/26

摘要文本

本发明提出一种基于机器学习的数据处理与识别模型的训练方法,属于数据处理技术领域,首先,采集土壤信息,并标注训练样本,用于模型的训练,对数据进行降维操作,然后通过一种基于快速聚类的SMOTE样本生成方法进行样本扩充,接下来采用神经网络对数据进行特征提取,提出一种基于搜索算子算法优化的神经网络模型对神经元的参数进行优化,避免了传统神经网络参数优化方法带来的梯度消失和梯度爆炸现象,最后提出一种基于改进随机森林的机器学习分类模型对高光谱数据进行分类,在决策树训练阶段,通过评估每棵决策树的分类性能,有效提高分类器的分类精度;本发明所设计的算法具有较高的检测精度,同时具有较高的鲁棒性能和泛化能力。 (来 自 马 克 数 据 网)

专利详细信息

项目 内容
专利名称 一种基于机器学习的数据处理与识别模型的训练方法
专利类型 发明申请
申请号 CN202410205784.5
申请日 2024/2/26
公告号 CN117789038A
公开日 2024/3/29
IPC主分类号 G06V20/10
权利人 聊城莱柯智能机器人有限公司; 数炬(山东)智能科技有限公司
发明人 张镇; 靖婉琦; 刘晨甲; 王兆信; 谢东明; 宋光恒; 孙德润; 徐如明
地址 山东省聊城市东昌府区古楼街道湖南西路西安交大科技园5号楼309室;

专利主权项内容

1.一种基于机器学习的数据处理与识别模型的训练方法,其特征在于,包括以下步骤:S1、土壤数据采集,并标注训练样本,用于模型训练;S2、数据降维,将高维特征变量重新组合,形成低维的线性无关的一组变量;S3、样本扩充,在少数样本的类别中生成新的样本,降低样本类别不均衡现象;S4、对S3中的数据进行特征提取,提出一种基于搜索算子算法优化的神经网络模型对神经元的参数进行优化,本步骤采用的神经网络层数为2层,基于搜索算子算法优化的神经网络模型中的搜索算子算法对参数进行搜索;S5、训练分类器机器学习模型;S6、应用训练好的模型进行土壤重金属污染程度,使用带标记的样本对上述模型进行训练,模型训练完成后,对待检测识别的数据进行检测识别。