Patent search ap:("东华大学") AND inv:"谭远良" Page 1

1.

发明公开
一种基于多策略深度强化学习的车间调度方法有权

公开(公告)号：CN112734286A

公开(公告)日：2021-04-30

申请号：CN202110087655.7

申请日：2021-01-22

Applicant: 东华大学

Inventor： 吕佑龙 , 谭远良 , 程辉 , 张洁 , 左丽玲

IPC: G06Q10/06 , G06Q10/04 , G06N3/00

Abstract: 本发明公开了一种基于多策略深度强化学习的车间调度方法，其特征在于，包括以下步骤，步骤一、导入随机算例；步骤二、输入MPS，确定各产品所需加工数量；步骤三、根据算例规模大小和MPS设定BAC方法参数；步骤四、进一步改变BAC方法参数进行正交实验，根据实验结果对BAC方法参数进行设置；步骤五、导入和读取目标算例和MPS，循环迭代更新网络；步骤六、通过Actor阶段与Critic阶段之间的循环迭代，输出合理的产品投产序列。

2.

发明授权
一种基于多策略深度强化学习的车间调度方法有权

公开(公告)号：CN112734286B

公开(公告)日：2023-04-07

申请号：CN202110087655.7

申请日：2021-01-22

Applicant: 东华大学

Inventor： 吕佑龙 , 谭远良 , 程辉 , 张洁 , 左丽玲

IPC: G06Q10/0631 , G06Q10/04 , G06N3/006

Abstract: 本发明公开了一种基于多策略深度强化学习的车间调度方法，其特征在于，包括以下步骤，步骤一、导入随机算例；步骤二、输入MPS，确定各产品所需加工数量；步骤三、根据算例规模大小和MPS设定BAC方法参数；步骤四、进一步改变BAC方法参数进行正交实验，根据实验结果对BAC方法参数进行设置；步骤五、导入和读取目标算例和MPS，循环迭代更新网络；步骤六、通过Actor阶段与Critic阶段之间的循环迭代，输出合理的产品投产序列。

Patent Agency Ranking