← 返回列表
机器人目标导航方法及装置
摘要文本
本发明提供一种机器人目标导航方法及装置,该方法包括:从待导航机器人在当前时刻之前预设时间段内各时刻的视觉观测数据中提取待导航机器人的视觉特征,并确定待导航机器人在预设时间段内各时刻接收的目标类别的语义嵌入信息,预设时间段包括当前时刻;根据当前时刻对应的语义嵌入信息对演员‑评论员算法中演员策略网络训练后的权重进行偏置,得到演员策略网络的最终权重;根据预设时间段内各时刻对应的视觉特征、语义嵌入信息和待导航机器人在预设时间段内除当前时刻以外各时刻的动作,基于最终权重对应的演员策略网络得到待导航机器人在当前时刻的动作。本发明实现提高机器人对未见类别的目标导航准确性。
申请人信息
- 申请人:中国科学院自动化研究所
- 申请人地址:100190 北京市海淀区中关村东路95号
- 发明人: 中国科学院自动化研究所
专利详细信息
| 项目 | 内容 |
|---|---|
| 专利名称 | 机器人目标导航方法及装置 |
| 专利类型 | 发明申请 |
| 申请号 | CN202311280776.9 |
| 申请日 | 2023/9/28 |
| 公告号 | CN117516530A |
| 公开日 | 2024/2/6 |
| IPC主分类号 | G01C21/20 |
| 权利人 | 中国科学院自动化研究所 |
| 发明人 | 张璐; 赵千帆; 刘智勇; 乔红 |
| 地址 | 北京市海淀区中关村东路95号 |
专利主权项内容
1.一种机器人目标导航方法,其特征在于,包括:从待导航机器人在当前时刻之前预设时间段内各时刻的视觉观测数据中提取所述待导航机器人的视觉特征,并确定所述待导航机器人在所述预设时间段内各时刻接收的目标类别的语义嵌入信息,所述预设时间段包括所述当前时刻;根据所述当前时刻对应的语义嵌入信息对演员-评论员算法中演员策略网络训练后的权重进行偏置,得到所述演员策略网络的最终权重;根据所述预设时间段内各时刻对应的视觉特征、语义嵌入信息和所述待导航机器人在所述预设时间段内除当前时刻以外各时刻的动作,基于所述最终权重对应的演员策略网络得到所述待导航机器人在所述当前时刻的动作;所述演员-评论员算法通过将机器人样本在所述预设时间段内各时刻的视觉观测数据和目标类别作为样本,将所述机器人样本对应的动作作为标签进行训练得到。