-
公开(公告)号:CN117647960A
公开(公告)日:2024-03-05
申请号:CN202311513142.3
申请日:2023-11-10
Applicant: 华中科技大学
IPC: G05B19/418
Abstract: 本发明公开了一种基于深度强化学习的车间调度方法、装置和系统,属于车间调度技术领域,所述方法包括:通过将动态柔性作业车间调度问题建模为数学模型,深度强化学习与组合优化问题的决策过程具有天然的相似性,在求解车间调度问题时也体现出良好性能。进一步地,将数学模型转化为马尔可夫决策过程;设计状态特征及其对应的动作,以对深度Q网络并进行训练,最终得到目标深度Q网络,利用所述目标深度Q网络进行车间调度,能够自适应灵活进行车间调度,实现智能车间的高效节能生产;由此解决现有调度方法不能满足制造系统的鲁棒性和高效率生产要求的技术问题。