一种基于强化学习的工作排程优化方法

    公开(公告)号:CN116307251B

    公开(公告)日:2023-09-19

    申请号:CN202310390230.2

    申请日:2023-04-12

    Abstract: 本发明提出一种基于强化学习的工作排程优化方法,旨在通过考虑员工实时疲劳程度,优化员工工作排程,进而缩短最大完工时间。首先,分析员工工作与休息状态下的效率变化曲线,构建工作‑休息排程的数学模型,将员工作业流程建立为马尔可夫决策过程;其次,基于SAC(Soft Actor Critic)算法设计智能体决策框架,实时调整员工工作与休息时长,以最大限度提高员工平均工作效率;此外,设计工作量快速适应机制,仅通过少量迁移训练,实现快速适应不同任务目标。仿真结果表明本发明能够优化员工工作排程方案,缩短最大完工时间,同时在工作量任务较大的情况下,可得到更好的优化效果,工作量快速适应机制使模型可以更灵活的应用于动态场景中。

    一种针对紧急突发状况的舰载机保障作业人员调度方法

    公开(公告)号:CN114595958B

    公开(公告)日:2022-10-04

    申请号:CN202210211487.2

    申请日:2022-02-28

    Abstract: 本发明公开了一种舰载机保障人员调度方法,应对甲板舰载机保障作业调度的不确定突发状况。首先将保障人员对舰载机的保障过程构造为马尔科夫决策过程;随后根据该过程特点设计一种改进的Soft Actor Critic(SAC)调度算法:(1)为降低学习难度,将SAC算法拓展为多智能体算法,并添加环境数据处理,减少智能体需处理的环境状态信息;(2)为避免动作冲突情况,设计自适应率以增加调度质量;(3)为优化整体训练过程,设置无效动作屏蔽机制、优先经验回放机制。最后将设计好的算法投入训练,完成训练的智能体即可投入调度。该方法能够较好地应对甲板出现的紧急突发状况,使得甲板调度对于不确定性有着更强的鲁棒性,增加了甲板调度的效率。

    基于深度强化学习的舰载机保障作业人员调度方法

    公开(公告)号:CN113706023B

    公开(公告)日:2022-07-12

    申请号:CN202111009089.4

    申请日:2021-08-31

    Abstract: 本发明公开了一种基于深度强化学习的舰载机保障作业人员调度方法,包括以下步骤:构建舰载机保障过程的马尔可夫决策过程(Markov Decision Process,MDP)模型,作为智能体训练环境;根据保障作业流程,确定智能体及其观测空间与动作空间;随后设计奖励函数、经验抽取机制和终止条件,并基于此设计网络结构;通过设置主要参数初始化环境,并采用多智能体深度确定策略梯度算法(Multi Agent Deep Deterministic Policy Gradient,MADDPG)训练智能体;最终使用完成训练智能体的决策辅助指挥人员进行保障作业人员调度。本发明可用于人员调度智能决策,将各类保障小组设定为智能体,辅助指挥人员和保障人员进行决策,提高保障作业决策效率,从而提高舰载机出动回收架次率。

    一种船用Magnus减摇装置粗糙度优化系统

    公开(公告)号:CN113553741B

    公开(公告)日:2022-02-11

    申请号:CN202110862922.3

    申请日:2021-07-29

    Abstract: 本发明是一种船用Magnus减摇装置粗糙度优化系统。包括:模型参数输入模块,用于接收相关参数信息并进行规范化处理,再将信息输出至受力分析模块;受力分析模块,依据参数信息对减摇装置的升/阻力作用情况进行分析并输出至虚拟仿真平台模块;粗糙度集输入模块,用于解析壁面函数,分析粗糙面分布规律,并将结果输出至虚拟仿真平台模块;虚拟仿真平台模块,依据输入的信息对减摇装置的升/阻力特性进行仿真试验并输出结果;粗糙度优化决策模块,对仿真试验结果进行优化分析。本发明优化了仿真模拟流程,提升了仿真工作效率,实现了对减摇装置表面粗糙度的优化设计,也为减摇装置的工程应用提供了可靠的理论分析平台。

    一种动态变采样区域RRT无人车路径规划方法

    公开(公告)号:CN113359775B

    公开(公告)日:2022-01-18

    申请号:CN202110774053.9

    申请日:2021-07-08

    Abstract: 本发明涉及一种基于动态变采样区域的概率目标偏置快速扩展随机树(RRT)无人车路径规划方法。所述方法包括:首先,初始化地图信息,根据动态变采样区域公式判断所处区域;在此基础上进行预留安全距离的碰撞检测,并根据概率目标偏置公式和步长选择公式生成新生节点,重复上述步骤直到满足新生节点和目标节点之间的距离小于距离阈值,反向搜索,输出路径;最后,考虑最大转角约束对输出路径进行逆向寻优和3次B样条曲线拟合优化,仿真验证了所述方法的有效性。本发明能够降低节点搜索的盲目性和随机性,减少路径搜索的时间,且规划的路径平滑符合车辆运动动力学约束。

    一种适用于全航速的船用减摇装置

    公开(公告)号:CN113815802A

    公开(公告)日:2021-12-21

    申请号:CN202111167518.0

    申请日:2021-10-07

    Abstract: 本发明公开了一种适用于全航速的船用减摇装置,包括:鳍型减摇装置、圆柱体减摇装置、圆柱体减摇装置传动杆、电动机、鳍型减摇装置传动杆、底座。本发明使用圆柱体减摇装置对传统减摇鳍的鳍头进行了改进,在保留了原有鳍头的流线型结构的基础上,融合了流体作用力的产生方式,本发明的优点在于:相较于传统减摇鳍、面积变形的平行四边形减摇鳍和Magnus减摇装置,提供的流体作用力的方向和大小恒定、并且不会受到攻角的限制也不会发生周期性的变化,此外在不耗费过多能源的前提下,具备了适用全航速的减摇能力,具有更为良好的使用价值。

    一种基于边界查找的双向跳点搜索无人车路径规划方法

    公开(公告)号:CN113515129A

    公开(公告)日:2021-10-19

    申请号:CN202110965209.1

    申请日:2021-08-23

    Abstract: 本发明涉及一种基于边界查找的双向跳点搜索无人车路径规划方法。所述方法包括:使用膨胀法对障碍物进行处理,采用栅格法划分搜索区域,将正向搜索和反向搜索的起始节点分别放入OpenList1和OpenList2中,从正向和反向进行跳点交替迭代搜索,利用边界查找优化水平和垂直方向的节点搜索和跳点识别,且将跳点分别添加到OpenList1和OpenList2中,采用改进的正向和反向启发式估价函数分别计算OpenList1和OpenList2中代价最小的跳点,直到正向和反向搜索的当前节点重合,搜索成功并保存正反方向搜索的路径节点即跳点坐标数据,采用微分平坦方法对生成的路径节点作曲线拟合。本发明可有效提高节点搜索和跳点识别效率,减少路径寻优时间,保证路径最优性,避免拟合后的路径与障碍物碰撞。

    一种基于强化学习的工作排程优化方法

    公开(公告)号:CN116307251A

    公开(公告)日:2023-06-23

    申请号:CN202310390230.2

    申请日:2023-04-12

    Abstract: 本发明提出一种基于强化学习的工作排程优化方法,旨在通过考虑员工实时疲劳程度,优化员工工作排程,进而缩短最大完工时间。首先,分析员工工作与休息状态下的效率变化曲线,构建工作‑休息排程的数学模型,将员工作业流程建立为马尔可夫决策过程;其次,基于SAC(Soft Actor Critic)算法设计智能体决策框架,实时调整员工工作与休息时长,以最大限度提高员工平均工作效率;此外,设计工作量快速适应机制,仅通过少量迁移训练,实现快速适应不同任务目标。仿真结果表明本发明能够优化员工工作排程方案,缩短最大完工时间,同时在工作量任务较大的情况下,可得到更好的优化效果,工作量快速适应机制使模型可以更灵活的应用于动态场景中。

    一种考虑海浪干扰的无人艇回收分布式决策仿真系统

    公开(公告)号:CN115453914A

    公开(公告)日:2022-12-09

    申请号:CN202211277205.5

    申请日:2022-10-19

    Abstract: 本发明公开了一种考虑海浪干扰的无人艇回收分布式决策仿真系统,完成海洋作业中母船对无人艇的自动回收任务。首先,搭建无人艇回收任务所需的仿真环境;基于DuelingNetwork算法设计决策模块,并针对应用场景优化神经网络结构,使决策模块具有短时记忆功能;实现分布式通信机制,将决策模块置于服务器端,环境模块置于客户端;最后,启动服务器与客户端程序,控制无人艇抽象的智能体完成回收任务。该系统针对实际复杂海况,设计模拟物理交互的仿真环境;采用深度强化学习算法,使得AI控制器应对复杂场景时,具有更强的鲁棒性,且让模型具有迁移学习能力;分布式通信机制将训练与控制独立运行,便于实现离线训练,同时可以实现远程控制效果。

    一种舵鳍系统的预测自抗扰减摇控制方法

    公开(公告)号:CN114815626B

    公开(公告)日:2022-10-28

    申请号:CN202210621013.5

    申请日:2022-06-02

    Abstract: 本发明公开一种舵鳍系统的预测自抗扰减摇控制方法,旨在解决舵鳍系统存在不确定扰动、状态耦合和输出延迟问题。分析船舶所受外力情况,建立三自由度船舶状态空间方程。针对不可观测状态,采用总扰动的思想解耦模型,分别设计纵摇自抗扰控制器和横艏摇预测观测器。横艏摇预测观测器在传统自抗扰的基础上尽可能多的保留原有的系统模型特性,只把状态耦合项、模型未知项、外部扰动等价为总扰动,单独考虑延迟问题。再利用强化学习不断地将系统的测量状态与模型的预测信息进行比较,并实时地修改预测模型和控制器参数,保证预测输出的准确度。最后利用二次规划求解舵角鳍角控制律。所述方法跟踪精度高,超调量小,减摇效果好。

Patent Agency Ranking