-
公开(公告)号:CN113591398A
公开(公告)日:2021-11-02
申请号:CN202110965400.6
申请日:2021-08-23
Applicant: 北京邮电大学
IPC: G06F30/27 , G06N3/04 , G06N3/08 , G06N7/00 , G06F111/04 , G06F111/08
Abstract: 本发明公开了一种基于深度强化学习的智能作业分批方法、装置及电子设备,涉及工业互联网技术领域。本发明实例包括以下步骤:获取每个作业的静态特征和动态特征,所述作业的静态特征包括作业交货期、作业的规格和工艺要求,所述作业的动态特征包括接收时刻;将所述各作业的静态特征和动态特征输入作业分批模块,作业分批模块利用马尔可夫决策过程将待组批作业集合中具有相似特征的作业组合为同一个批次,使最终组成的批次总数尽量少,且每个批次中的作业特征差异值尽量小。本发明可以充分利用工业互联网中大量的未标记数据学习稳定分批策略,并能处理有多维度特征的输入数据,给出稳定的、高效的作业分批解决方案,适用于作业量较大的应用场景中。
-
公开(公告)号:CN112508398A
公开(公告)日:2021-03-16
申请号:CN202011406748.3
申请日:2020-12-04
Applicant: 北京邮电大学
Abstract: 本发明实施例提供了一种基于深度强化学习的动态生产调度方法、装置及电子设备,涉及工业物联网技术领域,可以在不超过生产设备处理能力的基础上,减少作业整体处理时间。本发明实施例包括:获取各作业的静态特征和动态特征以及系统动态特征,将待调度的各作业的静态特征和动态特征以及系统动态特征输入调度模型,获得各作业在每个生产阶段的作业执行顺序或者批次执行顺序。其中,作业的静态特征包括任务量和完成所需时长,作业的动态特征包括接收时刻,系统动态特征包括每个生产阶段的设备能够执行的剩余任务量。调度模型为基于样本作业的静态特征和动态特征、系统动态特征以及第一critic网络,对第一actor网络进行训练后得到的模型。
-
公开(公告)号:CN113591398B
公开(公告)日:2023-05-23
申请号:CN202110965400.6
申请日:2021-08-23
Applicant: 北京邮电大学
IPC: G06F30/27 , G06N3/044 , G06N3/092 , G06N7/01 , G06F111/04 , G06F111/08
Abstract: 本发明公开了一种基于深度强化学习的智能作业分批方法、装置及电子设备,涉及工业互联网技术领域。本发明实例包括以下步骤:获取每个作业的静态特征和动态特征,所述作业的静态特征包括作业交货期、作业的规格和工艺要求,所述作业的动态特征包括接收时刻;将所述各作业的静态特征和动态特征输入作业分批模块,作业分批模块利用马尔可夫决策过程将待组批作业集合中具有相似特征的作业组合为同一个批次,使最终组成的批次总数尽量少,且每个批次中的作业特征差异值尽量小。本发明可以充分利用工业互联网中大量的未标记数据学习稳定分批策略,并能处理有多维度特征的输入数据,给出稳定的、高效的作业分批解决方案,适用于作业量较大的应用场景中。
-
公开(公告)号:CN112508398B
公开(公告)日:2022-09-16
申请号:CN202011406748.3
申请日:2020-12-04
Applicant: 北京邮电大学
Abstract: 本发明实施例提供了一种基于深度强化学习的动态生产调度方法、装置及电子设备,涉及工业物联网技术领域,可以在不超过生产设备处理能力的基础上,减少作业整体处理时间。本发明实施例包括:获取各作业的静态特征和动态特征以及系统动态特征,将待调度的各作业的静态特征和动态特征以及系统动态特征输入调度模型,获得各作业在每个生产阶段的作业执行顺序或者批次执行顺序。其中,作业的静态特征包括任务量和完成所需时长,作业的动态特征包括接收时刻,系统动态特征包括每个生产阶段的设备能够执行的剩余任务量。调度模型为基于样本作业的静态特征和动态特征、系统动态特征以及第一critic网络,对第一actor网络进行训练后得到的模型。
-
-
-