← 返回列表

一种基于空间引导自注意力的食品识别方法及系统

申请号: CN202410033038.2
申请人: 济南大学
申请日期: 2024/1/10

摘要文本

本发明提出了一种基于空间引导自注意力的食品识别方法及系统,涉及计算机视觉领域。本发明根据图像特征图获取目标位置编码,并根据编码引导自注意力机制只计算存在目标的位置,同时将图像特征图进行拆分处理,并以级联方式处理拆分的图像特征图,从而达到节约计算量的目的,另外根据目标位置编码的计算方式,也可以达到节约大量计算量,并为自注意力计算提供先验知识。

专利详细信息

项目 内容
专利名称 一种基于空间引导自注意力的食品识别方法及系统
专利类型 发明申请
申请号 CN202410033038.2
申请日 2024/1/10
公告号 CN117542045A
公开日 2024/2/9
IPC主分类号 G06V20/68
权利人 济南大学
发明人 李忠涛; 程文轩; 张波; 王凯; 张玉璘
地址 山东省济南市市中区南辛庄西路336号

专利主权项内容

1.一种基于空间引导自注意力的食品识别方法,其特征在于,包括以下步骤:S1、获取食品摄像头视频,每秒对摄像头进行抽帧,获得食品待检测图像;S2、构建空间引导自注意力模块,输入图像特征到该模块,将图像特征进行空间注意力操作,得到图像每个像素的空间位置得分,将得分进行阈值筛选,将得分高的像素位置视为存在目标位置,并将这些位置形成图像特征对应的目标位置编码,然后根据目标位置编码,将图像特征中非目标位置重置为0,然后将图像特征拆分为多个特征块,依次计算每个特征块,单个特征块生成对应Q、K、V,并进行自注意力计算,输出该特征块对应的优化特征,除第一个计算的特征块,每一个特征块和上一特征块对应的优化特征进行相加运算,然后再进行自注意力计算,所有特征块计算完毕,将所有的优化特征进行连接,得到和图像特征维度相同的优化图像特征,并进行输出;S3、构建食品检测模型,模型由骨干网络、空间引导自注意力模块、检测头组成;S4、将食品待检测图像输入进食品检测模型,获得食品检测结果。