← 返回列表
注意力机制下移动相机中判断物体运动状态方法及系统
摘要文本
马 克 数 据 网 。本发明公开了一种注意力机制下移动相机中判断物体运动状态方法及系统,基于deepstream框架的检测到对应目标后,将目标检测框像素分辨率扩大至M*N像素,然后使用针对分离的时空自注意力模块学习在一定连续时间t上检测扩大得到的M*N图像的时空连续性特征,最后接入一个MLP‑Head对学到的时空特征分类得到其运动状态。可以在移动相机情形下,结合深度学习自注意力机制在复杂场景下判断物体的运动与否。
申请人信息
- 申请人:成都合能创越软件有限公司
- 申请人地址:610000 四川省成都市高新区天府大道中段666号2栋23层2304、2305号
- 发明人: 成都合能创越软件有限公司
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 注意力机制下移动相机中判断物体运动状态方法及系统 |
| 专利类型 | 发明申请 |
| 申请号 | CN202410015759.0 |
| 申请日 | 2024/1/5 |
| 公告号 | CN117522925A |
| 公开日 | 2024/2/6 |
| IPC主分类号 | G06T7/246 |
| 权利人 | 成都合能创越软件有限公司 |
| 发明人 | 叶洪麟; 李骥东; 鲜斌 |
| 地址 | 四川省成都市高新区天府大道中段666号2栋23层2304、2305号 |
专利主权项内容
1.一种注意力机制下移动相机中判断物体运动状态方法,其特征在于,包括:获得多张待测图像;所述多张待测图像为移动的摄像设备在连续时间拍摄的按时间顺序排列的多张图像;所述待测图像包含待测目标;基于多张待测图像,通过跟踪算法,跟踪待测目标,得到多个目标跟踪框;一个目标跟踪框对应一张待测图像对应一个待测目标;基于待测图像和目标跟踪框,扩大像素,得到跟踪目标图像;多个目标跟踪框对应获得多个跟踪目标图像;将所述多个跟踪目标图像输入针对分离的时空自注意力模块,得到目标时空特征;所述目标时空特征包含多个跟踪目标图像在连续时间和空间上的特征;将所述目标时空特征输入分类器进行分类,判断待测目标是否运动。