本发明属于航空发动机控制技术领域,一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法。
本发明采用样本优先回放技术、目标神经网络技术对确定性策略梯度算法进行改进,将其作为变循环发动机多变量控制算法。
改进的确定性策略梯度算法可以加快神经网络的训练速度、保证神经网络参数更新过程的稳定性,实现变循环发动机全部可调部件的组合调节。
本发明设计的变循环发动机稳态多变量控制器,不需要对变量进行解耦控制,具有更好的可以可移植性。
加入的样本优先回放机制有利于提高了样本利用率,加速神经网络训练过程,同时双Actor‑Critic结构设计,利用目标神经网络计算真实神经网络梯度,使神经网络的训练过程更易于收敛。
杜宪 马艳华 孙希明 胡雪兰
大连理工大学
116024 辽宁省大连市甘井子区凌工路2号
本发明属于航空发动机控制技术领域,一种基于改进确定性策略梯度算法的变循环发动机控制器设计方法。
本发明采用样本优先回放技术、目标神经网络技术对确定性策略梯度算法进行改进,将其作为变循环发动机多变量控制算法。
改进的确定性策略梯度算法可以加快神经网络的训练速度、保证神经网络参数更新过程的稳定性,实现变循环发动机全部可调部件的组合调节。
本发明设计的变循环发动机稳态多变量控制器,不需要对变量进行解耦控制,具有更好的可以可移植性。
加入的样本优先回放机制有利于提高了样本利用率,加速神经网络训练过程,同时双Actor‑Critic结构设计,利用目标神经网络计算真实神经网络梯度,使神经网络的训练过程更易于收敛。