← 返回列表
一种基于空间引导自注意力的食品识别方法及系统
摘要文本
本发明提出了一种基于空间引导自注意力的食品识别方法及系统,涉及计算机视觉领域。本发明根据图像特征图获取目标位置编码,并根据编码引导自注意力机制只计算存在目标的位置,同时将图像特征图进行拆分处理,并以级联方式处理拆分的图像特征图,从而达到节约计算量的目的,另外根据目标位置编码的计算方式,也可以达到节约大量计算量,并为自注意力计算提供先验知识。
申请人信息
- 申请人:济南大学
- 申请人地址:250024 山东省济南市市中区南辛庄西路336号
- 发明人: 济南大学
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 一种基于空间引导自注意力的食品识别方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410033038.2 |
| 申请日 | 2024/1/10 |
| 公告号 | CN117542045A |
| 公开日 | 2024/2/9 |
| IPC主分类号 | G06V20/68 |
| 权利人 | 济南大学 |
| 发明人 | 李忠涛; 程文轩; 张波; 王凯; 张玉璘 |
| 地址 | 山东省济南市市中区南辛庄西路336号 |
专利主权项内容
1.一种基于空间引导自注意力的食品识别方法,其特征在于,包括以下步骤:S1、获取食品摄像头视频,每秒对摄像头进行抽帧,获得食品待检测图像;S2、构建空间引导自注意力模块,输入图像特征到该模块,将图像特征进行空间注意力操作,得到图像每个像素的空间位置得分,将得分进行阈值筛选,将得分高的像素位置视为存在目标位置,并将这些位置形成图像特征对应的目标位置编码,然后根据目标位置编码,将图像特征中非目标位置重置为0,然后将图像特征拆分为多个特征块,依次计算每个特征块,单个特征块生成对应Q、K、V,并进行自注意力计算,输出该特征块对应的优化特征,除第一个计算的特征块,每一个特征块和上一特征块对应的优化特征进行相加运算,然后再进行自注意力计算,所有特征块计算完毕,将所有的优化特征进行连接,得到和图像特征维度相同的优化图像特征,并进行输出;S3、构建食品检测模型,模型由骨干网络、空间引导自注意力模块、检测头组成;S4、将食品待检测图像输入进食品检测模型,获得食品检测结果。