目录

专利摘要

本发明属于航空发动机控制技术领域,一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法。
本发明采用样本优先回放技术、目标神经网络技术对确定性策略梯度算法进行改进,将其作为变循环发动机多变量控制算法。
改进的确定性策略梯度算法可以加快神经网络的训练速度、保证神经网络参数更新过程的稳定性,实现变循环发动机全部可调部件的组合调节。
本发明设计的变循环发动机稳态多变量控制器,不需要对变量进行解耦控制,具有更好的可以可移植性。
加入的样本优先回放机制有利于提高了样本利用率,加速神经网络训练过程,同时双Actor‑Critic结构设计,利用目标神经网络计算真实神经网络梯度,使神经网络的训练过程更易于收敛。

专利状态

基础信息

专利号
CN202010433366.3
申请日
2020-05-21
公开日
2020-09-18
公开号
CN111679576A
主分类号
/F/F02/ 机械工程;照明;加热;武器;爆破
标准类别
燃烧发动机;热气或燃烧生成物的发动机装置
批准发布部门
国家知识产权局
专利状态
发明公开

发明人

杜宪 马艳华 孙希明 胡雪兰

申请人

大连理工大学

申请人地址

116024 辽宁省大连市甘井子区凌工路2号

专利摘要

本发明属于航空发动机控制技术领域,一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法。
本发明采用样本优先回放技术、目标神经网络技术对确定性策略梯度算法进行改进,将其作为变循环发动机多变量控制算法。
改进的确定性策略梯度算法可以加快神经网络的训练速度、保证神经网络参数更新过程的稳定性,实现变循环发动机全部可调部件的组合调节。
本发明设计的变循环发动机稳态多变量控制器,不需要对变量进行解耦控制,具有更好的可以可移植性。
加入的样本优先回放机制有利于提高了样本利用率,加速神经网络训练过程,同时双Actor‑Critic结构设计,利用目标神经网络计算真实神经网络梯度,使神经网络的训练过程更易于收敛。

相似专利技术