一种基于空间引导自注意力的食品识别方法及系统

申请号: CN202410033038.2

申请人: 济南大学

申请日期: 2024/1/10

摘要文本

本发明提出了一种基于空间引导自注意力的食品识别方法及系统，涉及计算机视觉领域。本发明根据图像特征图获取目标位置编码，并根据编码引导自注意力机制只计算存在目标的位置，同时将图像特征图进行拆分处理，并以级联方式处理拆分的图像特征图，从而达到节约计算量的目的，另外根据目标位置编码的计算方式，也可以达到节约大量计算量，并为自注意力计算提供先验知识。

申请人信息

申请人:济南大学
申请人地址:250024 山东省济南市市中区南辛庄西路336号
发明人: 济南大学

专利详细信息

项目	内容
专利名称	一种基于空间引导自注意力的食品识别方法及系统
专利类型	发明申请
申请号	CN202410033038.2
申请日	2024/1/10
公告号	CN117542045A
公开日	2024/2/9
IPC主分类号	G06V20/68
权利人	济南大学
发明人	李忠涛; 程文轩; 张波; 王凯; 张玉璘
地址	山东省济南市市中区南辛庄西路336号

专利主权项内容

1.一种基于空间引导自注意力的食品识别方法，其特征在于，包括以下步骤：S1、获取食品摄像头视频，每秒对摄像头进行抽帧，获得食品待检测图像；S2、构建空间引导自注意力模块，输入图像特征到该模块，将图像特征进行空间注意力操作，得到图像每个像素的空间位置得分，将得分进行阈值筛选，将得分高的像素位置视为存在目标位置，并将这些位置形成图像特征对应的目标位置编码，然后根据目标位置编码，将图像特征中非目标位置重置为0，然后将图像特征拆分为多个特征块，依次计算每个特征块，单个特征块生成对应Q、K、V，并进行自注意力计算，输出该特征块对应的优化特征，除第一个计算的特征块，每一个特征块和上一特征块对应的优化特征进行相加运算，然后再进行自注意力计算，所有特征块计算完毕，将所有的优化特征进行连接，得到和图像特征维度相同的优化图像特征，并进行输出；S3、构建食品检测模型，模型由骨干网络、空间引导自注意力模块、检测头组成；S4、将食品待检测图像输入进食品检测模型，获得食品检测结果。

一种基于空间引导自注意力的食品识别方法及系统

摘要文本

申请人信息

专利详细信息

专利主权项内容

热门技术领域

快速入口

专利技术资料

一种基于空间引导自注意力的食品识别方法及系统

摘要文本

申请人信息

专利详细信息

专利主权项内容

相关专利推荐

一种粉煤灰砖块运输装置

一种桥梁支座调节机构

天然气管道安装辅助装置

一种自卸式半挂车

一种双红一紫火灾爆炸二合一火焰探测器

含气量自动解吸装置

热门技术领域

快速入口

专利技术资料