基于计算机视觉的冰箱食材识别定位方法及系统
摘要文本
本发明公开了基于计算机视觉的冰箱食材识别定位方法及系统,属于图像处理技术领域,要解决的技术问题为:如何实现遮挡情况下冰箱内食材的实时识别及定位。包括如下步骤:采集食材进出冰箱的过程,将得到的视频按照帧率切割为多个图像;基于融合CNN网络和Transformer网络的目标检测模型进行目标检测,得到预测框信息;基于食材样本库中样本图像对应的真实食材类别对通过目标检测模型预测的食材类别进行优化;对于图像序列对应的预测框,基于卡尔曼滤波预测食材的预定轨迹、并结合级联匹配和IOU匹配前后帧图像中食材的关联关系,得到每种食材的运动轨迹;将每种食材对应的预测框位置信息以及运动轨迹与冰箱内区域进行绑定。
申请人信息
- 申请人:浪潮软件科技有限公司
- 申请人地址:250000 山东省济南市高新区浪潮路1036号浪潮科技园
- 发明人: 浪潮软件科技有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 基于计算机视觉的冰箱食材识别定位方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410190626.7 |
| 申请日 | 2024/2/21 |
| 公告号 | CN117746304A |
| 公开日 | 2024/3/22 |
| IPC主分类号 | G06V20/40 |
| 权利人 | 浪潮软件科技有限公司 |
| 发明人 | 崔国靖; 王勇; 张峰; 朱邱悦; 公茂强; 吴辉 |
| 地址 | 山东省济南市高新区浪潮路1036号浪潮科技园 |
专利主权项内容
1.一种基于计算机视觉的冰箱食材识别定位方法,其特征在于,包括如下步骤:图像采集:通过固定于冰箱内的广角摄像头采集食材进出冰箱的过程,将得到的视频按照帧率切割为多个图像,得到图像序列;图像预处理:对每个图像进行预处理,通过预处理对图像进行缩放并对图像中空白区域进行填充,得到预处后图像;目标检测:对于每个预处理后图像,基于融合CNN网络和Transformer网络的目标检测模型进行目标检测,得到包含目标食材的预测框,并输出预测框信息,预测框信息包括预测框的位置信息以及食材类别,预测框的位置信息用于表示预测框相对于其所在对应图像的位置;识别优化:对于每个预测框,计算预测框与食材样本库中样本图像的相似度,基于相似度判断目标检测模型预测的食材类别是否正确,如果不正确,基于食材样本库中样本图像对应的真实食材类别对通过目标检测模型预测的食材类别进行优化,得到优化后预测框信息;多目标追踪:对于图像序列对应的预测框,基于卡尔曼滤波预测食材的轨迹、并结合级联匹配和IOU匹配计算前后帧图像中食材的关联关系,得到每种食材的运动轨迹;目标定位:基于优化后预测框信息以及每种食材的运动轨迹,将每种食材对应的预测框位置信息以及运动轨迹与冰箱内区域进行绑定,得到食材的定位信息。