-
公开(公告)号:CN116738923B
公开(公告)日:2024-04-05
申请号:CN202310359245.2
申请日:2023-04-04
Applicant: 暨南大学
IPC: G06F30/392 , G06F30/3308 , G06F30/367 , G06F30/27 , G06N3/006 , G06F111/04
Abstract: 本发明提出了一种基于带约束强化学习的芯片布局优化方法,属于集成电路领域,方法包括:对芯片布局问题建立基于马尔可夫决策过程的模型;针对芯片设计布局领域,区分硬约束和软约束;设计强化学习算法处理硬约束和软约束;设计奖励函数分别处理硬约束和软约束;利用带约束的强化学习算法训练智能体,使智能体在满足硬约束的前提下,找到优化软约束的策略;在智能体训练完成后,将其应用于实际的芯片布局问题,通过智能体执行的动作序列,得到一个优化的布局方案。本发明通过采用带约束的强化学习算法和针对性的约束处理方式,可以在满足硬约束的前提下,对软约束进行优化,从而实现高性能、低功耗的芯片布局方案。
-
公开(公告)号:CN116594358A
公开(公告)日:2023-08-15
申请号:CN202310436057.5
申请日:2023-04-20
Applicant: 暨南大学
IPC: G05B19/418
Abstract: 本发明提出了一种基于强化学习的多层工厂车间调度方法,包括:建立多层工厂车间物流网络模型;收集数据,采用边缘计算算法对数据进行实时预处理和分析,采用联邦学习技术对分散在不同设备上的数据进行分布式学习;设计强化学习模型;实时调度执行,使用模型预测控制技术,生成鲁棒调度策略,然后采用事件驱动调度方法,提高调度系统的适应性;采用多层工厂在线强化学习方法,强化学习模型实时更新参数,然后采用迁移学习技术,提升强化学习模型的学习效果和泛化能力;采用贝叶斯优化算法和进化算法,优化物流网络模型。本发明通过设计在线学习方法的形式在多层工厂调度问题中实现高效率协同的分布式计算,能够快速适应环境的变化。
-
公开(公告)号:CN117636623B
公开(公告)日:2024-08-16
申请号:CN202311421338.X
申请日:2023-10-30
Applicant: 暨南大学
Abstract: 本发明提出了一种基于离线强化学习的信号灯及路由协同控制方法,方法包括:获取不同的数据源的数据,并对数据进行预处理;设计数据源优先等级,根据数据源的优先级对数据源输入图神经网络模型的优先级进行控制;设置自适应数据融合算法对数据进行融合;使用离线强化学习算法对预处理后的数据和奖励函数进行图神经网络模型训练;实时检测交通状态和图神经网络模型输出,并在检测到异常或不安全情况时切换到预定义的安全策略。本发明通过这种协同优化的方式,不仅能有效地解决复杂和动态的交通问题,而且具有很高的安全性和用户体验,是一种具有高度创新性和实用性的交通管理解决方案。
-
公开(公告)号:CN117787186A
公开(公告)日:2024-03-29
申请号:CN202311842531.0
申请日:2023-12-28
Applicant: 暨南大学
IPC: G06F30/392 , G06N3/09 , G06N3/092
Abstract: 本发明提出了基于分层强化学习的多目标芯片布局优化方法,所述方法包括:构建分层强化学习的基本框架,确定优化目标,定义状态空间、动作空间、奖励函数;将布局问题分解成子任务,构建基于子任务的分层强化学习框架;引入图神经网络改进状态表示,设计多层次图神经网络,并将图神经网络与强化学习结合进行训练;设计多目标优化策略,并调整动态权重系数;根据多目标优化策略调整奖励机制,并引入策略微调机制进行策略微调,再将动态权重系数调整为自适应权重系数;设计跨尺度策略进行跨尺度协调和同步,优化布局策略。本发明不仅提高了问题处理的效率,而且通过专注于局部优化,改善了整体布局的质量。
-
公开(公告)号:CN117669984A
公开(公告)日:2024-03-08
申请号:CN202311750332.7
申请日:2023-12-18
Applicant: 暨南大学 , 广东云熵科技有限公司
IPC: G06Q10/0631 , G06N5/02 , G06N3/092 , G06F18/241
Abstract: 本发明提出了基于数字孪生及知识图谱的强化学习的车间调度方法,包括:建立数据接收与存储结构收集多模态数据,根据多模态数据生成标签和元数据,并利用图模型的连接性预测与现有数据相关的标签和元数据;对生成的标签和元数据进行数据质量评估与过滤,所述数据质量评估是根据数据质量评分进行评估;设计多层次车间状态表示并建立车间数字孪生模型;构建知识图谱和可解释强化学习模型;根据可解释强化学习模型生成决策逻辑和解释决策逻辑;根据决策逻辑和车间数字孪生模型搭建实验环境并评估实验性能。本发明综合性地解决了车间调度的效率、成本和解释性问题。
-
公开(公告)号:CN116594358B
公开(公告)日:2024-01-02
申请号:CN202310436057.5
申请日:2023-04-20
Applicant: 暨南大学
IPC: G05B19/418
Abstract: 本发明提出了一种基于强化学习的多层工厂车间调度方法,包括:建立多层工厂车间物流网络模型;收集数据,采用边缘计算算法对数据进行实时预处理和分析,采用联邦学习技术对分散在不同设备上的数据进行分布式学习;设计强化学习模型;实时调度执行,使用模型预测控制技术,生成鲁棒调度策略,然后采用事件驱动调度方法,提高调度系统的适应性;采用多层工厂在线强化学习方法,强化学习模型实时更新参数,然后采用迁移学习技术,提升强化学习模型的学习效果和泛化能力;采用贝叶斯优化算法和进化算法,优化物流网络模型。本发明通过设计在线学习方法的形式在多层工厂调度问题中实现高效率协同的分布式计算,能够快速适应环境的变化。
-
公开(公告)号:CN116307440B
公开(公告)日:2023-11-17
申请号:CN202211456989.8
申请日:2022-11-21
Applicant: 暨南大学 , 广东云熵科技有限公司
IPC: G06Q10/0631 , G06Q50/04
Abstract: 本发明公开了一种基于强化学习的多目标权重学习的车间调度方法及其装置和应用,属于人工智能技术领域。本发明提出了一种基于强化学习的多目标权重学习车间调度方法,通过不断收集、分析车间中的不同目标所衍生的状态数据,进而对多个目标的调度进行不断优化,最终得到最优的调度方式,从而有效优化了车间作业流程,提高生产效率;本发明可根据实际生产状态调整不同优化目标的优先程度,动态性更强,可更好应对不同生产状况;本发明所获得的调度结果与传统的解决多目标车间调度问题的方法相比更佳,对人工智能更好地用于生产具有重要的意义。
-
公开(公告)号:CN117787186B
公开(公告)日:2024-08-23
申请号:CN202311842531.0
申请日:2023-12-28
Applicant: 暨南大学
IPC: G06F30/392 , G06N3/09 , G06N3/092
Abstract: 本发明提出了基于分层强化学习的多目标芯片布局优化方法,所述方法包括:构建分层强化学习的基本框架,确定优化目标,定义状态空间、动作空间、奖励函数;将布局问题分解成子任务,构建基于子任务的分层强化学习框架;引入图神经网络改进状态表示,设计多层次图神经网络,并将图神经网络与强化学习结合进行训练;设计多目标优化策略,并调整动态权重系数;根据多目标优化策略调整奖励机制,并引入策略微调机制进行策略微调,再将动态权重系数调整为自适应权重系数;设计跨尺度策略进行跨尺度协调和同步,优化布局策略。本发明不仅提高了问题处理的效率,而且通过专注于局部优化,改善了整体布局的质量。
-
公开(公告)号:CN116612636B
公开(公告)日:2024-01-23
申请号:CN202310582760.7
申请日:2023-05-22
Applicant: 暨南大学
IPC: G08G1/01 , G06F18/25 , G06F18/213 , G06N3/092 , G06N3/042 , G06N3/0464 , G08G1/052 , G08G1/095 , G08G1/08
Abstract: 本发明提出了一种基于多智能体强化学习及多模态信号感知的信号灯协同控制方法,包括:收集各种传感器的数据和进行多模态定义,通过数据融合技术实时获取信息;采用协同车路多智能体强化学习算法对信号灯与车辆进行协同控制;根据各种传感器的收集数据进行预处理,利用特征融合方法将不同模态的数据融合,为每个智能体构建局部状态空间;为信号灯智能体和车辆智能体设计动作空间;根据交通流控制的目标,为多智能体强化学习设计奖励函数;设计适用于车路协同控制场景的通信协议;使用历史数据或仿真环境对多智能体强化学习模型进行训练,找到最优策略。本发明通过引入车辆作(56)对比文件杨山田.基于多智能体深度强化学习的交通信号控制算法研究.中国博士学位论文全文数据库 工程科技Ⅱ辑.2023,(第1期),第66-72页.丛珊.基于多智能体强化学习的交通信号灯协同控制算法的研究.中国优秀硕士学位论文全文数据库 工程科技Ⅱ辑.2023,(第1期),第19-24页.孙浩 等.基于深度强化学习的交通信号控制方法.计算机科学.2020,第47卷(第2期),第169-174页.
-
公开(公告)号:CN116307241B
公开(公告)日:2024-01-05
申请号:CN202310355705.4
申请日:2023-04-04
Applicant: 暨南大学
Inventor: 欧阳雅捷
IPC: G06Q10/04 , G06Q10/0631 , G06Q50/04 , G06N3/006
Abstract: 本发明提出了一种基于带约束多智能体强化学习的分布式作业车间调度方法,建立分布式作业车间调度问题模型,将分布式作业车间调度问题转化为多智能体强化学习问题;设计带约束约束多智能体强化学习算法处理约束条件;对约束条件进行处理;利用带约束多智能体强化学习算法训练多个智能体,实现分布式作业车间调度的优化,结合实际应用。该方法通过多智能体强化学习实现分布式调度策略的优化,并考虑约束条件以满足实际生产需求。本发明旨在充分利用多智能体强化学习方法的优势,并考虑约束条件,实现高效且满足约束条件的作业车间调度。
-
-
-
-
-
-
-
-
-