一种基于深度Q网络改进的多目标进化算法

    公开(公告)号:CN116050514A

    公开(公告)日:2023-05-02

    申请号:CN202310012540.0

    申请日:2023-01-05

    Applicant: 上海大学

    Inventor: 冯国瑞 周雨

    Abstract: 本发明公开了一种基于深度Q网络改进的多目标进化算法。本算法的操作步骤如下:(1)设计深度Q网络中的状态空间s、动作空间a、奖励模型r;(2)进化过程中训练智能体,在每一个时间步骤上,智能体从动作空间中选择一个动作,该动作被传递给种群。更新种群收敛性和多样性的指标来描述状态,同时计算相应的奖励值,将经验(st,at,rt,st+1)存储到经验池中;(3)从经验池中获取经验进行学习,更新神经网络参数,实现最优的选择策略。本发明在多目标进化算法中引入深度Q网络学习思想,智能体通过与环境进行交互得到行动反馈,利用奖励机制优化个体选择。

Patent Agency Ranking