一种基于带约束强化学习的芯片布局优化方法

    公开(公告)号:CN116738923A

    公开(公告)日:2023-09-12

    申请号:CN202310359245.2

    申请日:2023-04-04

    Applicant: 暨南大学

    Abstract: 本发明提出了一种基于带约束强化学习的芯片布局优化方法,属于集成电路领域,方法包括:对芯片布局问题建立基于马尔可夫决策过程的模型;针对芯片设计布局领域,区分硬约束和软约束;设计强化学习算法处理硬约束和软约束;设计奖励函数分别处理硬约束和软约束;利用带约束的强化学习算法训练智能体,使智能体在满足硬约束的前提下,找到优化软约束的策略;在智能体训练完成后,将其应用于实际的芯片布局问题,通过智能体执行的动作序列,得到一个优化的布局方案。本发明通过采用带约束的强化学习算法和针对性的约束处理方式,可以在满足硬约束的前提下,对软约束进行优化,从而实现高性能、低功耗的芯片布局方案。

    基于带约束多智能体强化学习的分布式作业车间调度方法

    公开(公告)号:CN116307241A

    公开(公告)日:2023-06-23

    申请号:CN202310355705.4

    申请日:2023-04-04

    Applicant: 暨南大学

    Inventor: 欧阳雅捷

    Abstract: 本发明提出了一种基于带约束多智能体强化学习的分布式作业车间调度方法,建立分布式作业车间调度问题模型,将分布式作业车间调度问题转化为多智能体强化学习问题;设计带约束约束多智能体强化学习算法处理约束条件;对约束条件进行处理;利用带约束多智能体强化学习算法训练多个智能体,实现分布式作业车间调度的优化,结合实际应用。该方法通过多智能体强化学习实现分布式调度策略的优化,并考虑约束条件以满足实际生产需求。本发明旨在充分利用多智能体强化学习方法的优势,并考虑约束条件,实现高效且满足约束条件的作业车间调度。

    基于数字孪生及知识图谱的强化学习的车间调度方法

    公开(公告)号:CN117669984B

    公开(公告)日:2024-11-05

    申请号:CN202311750332.7

    申请日:2023-12-18

    Abstract: 本发明提出了基于数字孪生及知识图谱的强化学习的车间调度方法,包括:建立数据接收与存储结构收集多模态数据,根据多模态数据生成标签和元数据,并利用图模型的连接性预测与现有数据相关的标签和元数据;对生成的标签和元数据进行数据质量评估与过滤,所述数据质量评估是根据数据质量评分进行评估;设计多层次车间状态表示并建立车间数字孪生模型;构建知识图谱和可解释强化学习模型;根据可解释强化学习模型生成决策逻辑和解释决策逻辑;根据决策逻辑和车间数字孪生模型搭建实验环境并评估实验性能。本发明综合性地解决了车间调度的效率、成本和解释性问题。

    一种智能路线规划方法及系统

    公开(公告)号:CN117392834B

    公开(公告)日:2024-07-02

    申请号:CN202311227186.X

    申请日:2023-09-21

    Applicant: 暨南大学

    Abstract: 本发明提出了一种智能路线规划方法及系统,方法包括:收集道路数据并进行预处理;对预处理后的数据构建模型进行分析;对模型进行训练:根据模型输出的概率值进行分析与验证,提出路线规划建议和进行报警。本发明通过实时预测道路上的异常情况,如交通事故或道路维修,并为用户提供智能的路线规划建议。系统结合了多种数据源,如用户的速度和位置数据、用户反馈、天气数据等,通过深度学习模型进行分析,实现高准确性的道路异常预测。

    一种基于离线强化学习的信号灯及路由协同控制方法

    公开(公告)号:CN117636623A

    公开(公告)日:2024-03-01

    申请号:CN202311421338.X

    申请日:2023-10-30

    Applicant: 暨南大学

    Inventor: 欧阳雅捷 赵阔

    Abstract: 本发明提出了一种基于离线强化学习的信号灯及路由协同控制方法,方法包括:获取不同的数据源的数据,并对数据进行预处理;设计数据源优先等级,根据数据源的优先级对数据源输入图神经网络模型的优先级进行控制;设置自适应数据融合算法对数据进行融合;使用离线强化学习算法对预处理后的数据和奖励函数进行图神经网络模型训练;实时检测交通状态和图神经网络模型输出,并在检测到异常或不安全情况时切换到预定义的安全策略。本发明通过这种协同优化的方式,不仅能有效地解决复杂和动态的交通问题,而且具有很高的安全性和用户体验,是一种具有高度创新性和实用性的交通管理解决方案。

    一种用于芯片布局问题的多目标分层强化学习方法

    公开(公告)号:CN116402002B

    公开(公告)日:2024-02-06

    申请号:CN202310386626.X

    申请日:2023-04-12

    Applicant: 暨南大学

    Inventor: 欧阳雅捷

    Abstract: 本发明提出了一种基于带约束强化学习的芯片布局优化方法,属于电子工程领域,方法包括:收集芯片设计信息指标,对信息指标和芯片布局进行预处理,定义强化学习空间;对芯片布局进行优化训练;对多目标芯片布局进行高效优化;验证和调整芯片布局;对芯片布局进行后处理。本发明将芯片布局问题分解为多个子问题,并使用分层强化学习算法(如分层深度Q网络)来优化各个子问题,将多目标强化学习应用于芯片布局设计具有明显的必要性和优势。它能够在复杂多目标优化场景下找到全局最优解,同时权衡性能、功耗和尺寸等多个因素,实现整体性能的优化。此外,通过与其他优化算法相结合,多目标强化学习方法在芯片布局设计领域具有广泛的应用前景。

    一种智能路线规划方法及系统
    18.
    发明公开

    公开(公告)号:CN117392834A

    公开(公告)日:2024-01-12

    申请号:CN202311227186.X

    申请日:2023-09-21

    Applicant: 暨南大学

    Abstract: 本发明提出了一种智能路线规划方法及系统,方法包括:收集道路数据并进行预处理;对预处理后的数据构建模型进行分析;对模型进行训练:根据模型输出的概率值进行分析与验证,提出路线规划建议和进行报警。本发明通过实时预测道路上的异常情况,如交通事故或道路维修,并为用户提供智能的路线规划建议。系统结合了多种数据源,如用户的速度和位置数据、用户反馈、天气数据等,通过深度学习模型进行分析,实现高准确性的道路异常预测。

    基于多智能体强化学习及多模态信号感知的信号灯协同控制方法

    公开(公告)号:CN116612636A

    公开(公告)日:2023-08-18

    申请号:CN202310582760.7

    申请日:2023-05-22

    Applicant: 暨南大学

    Abstract: 本发明提出了一种基于多智能体强化学习及多模态信号感知的信号灯协同控制方法,包括:收集各种传感器的数据和进行多模态定义,通过数据融合技术实时获取信息;采用协同车路多智能体强化学习算法对信号灯与车辆进行协同控制;根据各种传感器的收集数据进行预处理,利用特征融合方法将不同模态的数据融合,为每个智能体构建局部状态空间;为信号灯智能体和车辆智能体设计动作空间;根据交通流控制的目标,为多智能体强化学习设计奖励函数;设计适用于车路协同控制场景的通信协议;使用历史数据或仿真环境对多智能体强化学习模型进行训练,找到最优策略。本发明通过引入车辆作为智能体,实现更有效的车路协同,进一步提高交通控制效果。

    一种用于芯片布局问题的多目标分层强化学习方法

    公开(公告)号:CN116402002A

    公开(公告)日:2023-07-07

    申请号:CN202310386626.X

    申请日:2023-04-12

    Applicant: 暨南大学

    Inventor: 欧阳雅捷

    Abstract: 本发明提出了一种基于带约束强化学习的芯片布局优化方法,属于电子工程领域,方法包括:收集芯片设计信息指标,对信息指标和芯片布局进行预处理,定义强化学习空间;对芯片布局进行优化训练;对多目标芯片布局进行高效优化;验证和调整芯片布局;对芯片布局进行后处理。本发明将芯片布局问题分解为多个子问题,并使用分层强化学习算法(如分层深度Q网络)来优化各个子问题,将多目标强化学习应用于芯片布局设计具有明显的必要性和优势。它能够在复杂多目标优化场景下找到全局最优解,同时权衡性能、功耗和尺寸等多个因素,实现整体性能的优化。此外,通过与其他优化算法相结合,多目标强化学习方法在芯片布局设计领域具有广泛的应用前景。

Patent Agency Ranking