← 返回列表

一种多源信息融合的图像目标检测方法

申请号: CN202410252344.5
申请人: 潍坊科技学院
申请日期: 2024/3/6

摘要文本

本发明公开一种多源信息融合的图像目标检测方法,涉及图像目标检测技术领域, 包括:S1:图像数据采集及处理;S11:复杂背景下多源信息融合的图像数据采集;S12:数据人工筛选和裁剪;S13:数据标注;S14:数据增强;S2:构建图像数据处理网络;S21:时空融合注意力网络;S22:多层编解码特征融合网络;S23:联合损失函数;S24:多源信息融合的图像目标检测方法;S3:建立评价指标。本发明综合时空融合注意力网络和多层编解码特征融合网络,形成多源信息融合的图像目标检测方法,在自建数据集上验证所提方法的有效性。

专利详细信息

项目 内容
专利名称 一种多源信息融合的图像目标检测方法
专利类型 发明申请
申请号 CN202410252344.5
申请日 2024/3/6
公告号 CN117830788A
公开日 2024/4/5
IPC主分类号 G06V10/80
权利人 潍坊科技学院
发明人 王学伟; 刘君
地址 山东省潍坊市寿光市金光街1299号

专利主权项内容

1.一种多源信息融合的图像目标检测方法,其特征在于,包括:S1:图像数据采集及处理;S11:复杂背景下多源信息融合的图像数据采集;在不同时间、不同环境、不同角度下,使用数码相机、监控摄像机或智能手机设备采集复杂背景下的图像数据,在深入分析图像文本多源信息的基础上,融合目标特征描述、目标位置信息、目标周围环节信息等知识集,构建复杂背景下多源信息融合的图像数据集; S12:数据人工筛选和裁剪;原始数据集中存在图像数据总样本少、不同图像数据样本分布不均衡、同种图像不同目标类型样本数量存在差距问题,因此,通过数据预处理及模型结构优化方式降低这些问题对模型性能的影响;S13:数据标注;在采集到的图像中,目标区域存在重叠或遮挡现象,图像标注时需要确保每个目标区域都有一个单独的标注,因此,对于重叠或遮挡的区域,使用人工经验来预估边界框应当包含的区域大小,为保证标注的正确性和权威性,图像首先被分类到其对应的一般类别,然后由不同领域的专家组分别对这些类别中的具体对象进行标注,标注完成后,由跨领域的专家组进行交叉检查,以确保标注的一致性和减少错误,这样的流程能广泛适用于多种类型的对象目标检测;S14:数据增强;采用水平翻转、垂直翻转、亮度变换、对比度变换和饱和度变换5种方式进行数据增强操作;S2:构建图像数据处理网络;S21:时空融合注意力网络;S22:多层编解码特征融合网络;S23:联合损失函数;S24:多源信息融合的图像目标检测方法;S3:建立评价指标。