-
公开(公告)号:CN118154090A
公开(公告)日:2024-06-07
申请号:CN202410301933.8
申请日:2024-03-17
Applicant: 同济大学
IPC: G06Q10/087 , G06N3/0455 , G06N3/092
Abstract: 本发明公开了一种基于Transformer的供应链库存管理方法。本发明针对飞机制造供应链库存管理模型规模增速较快、决策复杂度较高的问题,基于多智能体强化学习序列决策的本质,将多智能体强化学习问题转化为编码器‑解码器架构的序列建模问题,从逻辑上降低算法的复杂度。本发明设计了轻量化编码器模块以及自回归解码器模块:轻量化编码器模块通过利用傅里叶变换的对偶性,对复杂度较高的自注意力机制进行替换,从实现上降低算法复杂度;自回归解码器模块基于信息传递机制的思想,通过自回归顺序决策的方式保证供应链整体的联合策略单调改善。本方法能够在保持性能的基础上,在训练时间、模型参数量等方面相对于现有其他方法实现有效简化。
-
公开(公告)号:CN116823107A
公开(公告)日:2023-09-29
申请号:CN202310644671.0
申请日:2023-06-01
Applicant: 同济大学
IPC: G06Q10/087 , G06N20/00 , G06N3/092 , G06N3/04
Abstract: 本发明公开了基于多智能体强化学习的供应链库存管理方法。本发明针对现有的基于多智能体强化学习供应链库存管理方法在供应链参与方较多时状态空间和动作空间过大时表现不佳以及无法有效进行供应链参与者之间的协同合作的问题,提出了带有信息传递机制的双策略多智能体强化学习算法,利用双策略机制在训练初期最大化利用局部策略对状态空间进行探索,在训练过程中逐渐转向团队策略,实现对状态空间的有效探索;并利用了一种信息传递机制来使得供应链参与方在进行策略更新时互通有无,以实现高效协同合作。
-