一种基于多策略深度强化学习的车间调度方法

    公开(公告)号:CN112734286A

    公开(公告)日:2021-04-30

    申请号:CN202110087655.7

    申请日:2021-01-22

    Applicant: 东华大学

    Abstract: 本发明公开了一种基于多策略深度强化学习的车间调度方法,其特征在于,包括以下步骤,步骤一、导入随机算例;步骤二、输入MPS,确定各产品所需加工数量;步骤三、根据算例规模大小和MPS设定BAC方法参数;步骤四、进一步改变BAC方法参数进行正交实验,根据实验结果对BAC方法参数进行设置;步骤五、导入和读取目标算例和MPS,循环迭代更新网络;步骤六、通过Actor阶段与Critic阶段之间的循环迭代,输出合理的产品投产序列。

    一种基于多策略深度强化学习的车间调度方法

    公开(公告)号:CN112734286B

    公开(公告)日:2023-04-07

    申请号:CN202110087655.7

    申请日:2021-01-22

    Applicant: 东华大学

    Abstract: 本发明公开了一种基于多策略深度强化学习的车间调度方法,其特征在于,包括以下步骤,步骤一、导入随机算例;步骤二、输入MPS,确定各产品所需加工数量;步骤三、根据算例规模大小和MPS设定BAC方法参数;步骤四、进一步改变BAC方法参数进行正交实验,根据实验结果对BAC方法参数进行设置;步骤五、导入和读取目标算例和MPS,循环迭代更新网络;步骤六、通过Actor阶段与Critic阶段之间的循环迭代,输出合理的产品投产序列。

Patent Agency Ranking