-
公开(公告)号:CN112734286A
公开(公告)日:2021-04-30
申请号:CN202110087655.7
申请日:2021-01-22
Applicant: 东华大学
Abstract: 本发明公开了一种基于多策略深度强化学习的车间调度方法,其特征在于,包括以下步骤,步骤一、导入随机算例;步骤二、输入MPS,确定各产品所需加工数量;步骤三、根据算例规模大小和MPS设定BAC方法参数;步骤四、进一步改变BAC方法参数进行正交实验,根据实验结果对BAC方法参数进行设置;步骤五、导入和读取目标算例和MPS,循环迭代更新网络;步骤六、通过Actor阶段与Critic阶段之间的循环迭代,输出合理的产品投产序列。
-
公开(公告)号:CN112734286B
公开(公告)日:2023-04-07
申请号:CN202110087655.7
申请日:2021-01-22
Applicant: 东华大学
IPC: G06Q10/0631 , G06Q10/04 , G06N3/006
Abstract: 本发明公开了一种基于多策略深度强化学习的车间调度方法,其特征在于,包括以下步骤,步骤一、导入随机算例;步骤二、输入MPS,确定各产品所需加工数量;步骤三、根据算例规模大小和MPS设定BAC方法参数;步骤四、进一步改变BAC方法参数进行正交实验,根据实验结果对BAC方法参数进行设置;步骤五、导入和读取目标算例和MPS,循环迭代更新网络;步骤六、通过Actor阶段与Critic阶段之间的循环迭代,输出合理的产品投产序列。
-