基于强化学习及遗传算法的柔性车间调度方法及模型

    公开(公告)号:CN114186749B

    公开(公告)日:2022-06-28

    申请号:CN202111546245.0

    申请日:2021-12-16

    Applicant: 暨南大学

    Abstract: 本发明提供了一种基于强化学习及遗传算法的柔性车间调度方法及模型,属于人工智能技术领域。根据柔性作业车间的特点,建立柔性作业车间调度模型;对遗传算法和基于熵的置信域优化强化学习算法中的基本参数进行初始化;利用基于熵的置信域优化算法更新遗传算法中的参数,并分别对参与交叉和变异的染色体种群进行交叉和变异操作,生成参与交叉和变异的新染色体种群;计算新种群中每个个体的适应度,确定基于熵的置信域优化算法中的状态参数,对新染色体种群执行遗传算法操作;反复执行上述迭代至截止,并输出结果。本发明将基于熵的置信域优化强化学习算法与遗传算法相结合,提高了柔性车间调度的性能,增强车间生产的鲁棒性,提高生产效率。

    一种基于离线强化学习的智能机器人对话方法及系统

    公开(公告)号:CN113360618B

    公开(公告)日:2022-03-11

    申请号:CN202110633919.4

    申请日:2021-06-07

    Applicant: 暨南大学

    Abstract: 本发明提出一种基于离线强化学习的智能机器人对话方法及系统,方法包括获取已有的对话数据信息,基于对话数据构建训练集;在训练集抽取预设关键信息,对关键信息进行数据处理,引入非策略的批量强化学习算法;构建基于对话预判模型,并利用基于关键信息得到的数据对模型进行训练;获取待交流对话的数据信息;从数据信息中抽取预设关键信息,通过数据处理得到第一向量;利用已训练的模型处理第一向量,得到对应的第一标签,根据第一向量和第一标签进行决策输出;基于决策与用户进行对话。系统包括GPU服务器、模型存储器、存储模块、语言数据库、离线强化学习处理器、CPU处理器、语言收集模块和智能对话执行模块。

    基于ZigBee的智能园林讲解系统及控制方法

    公开(公告)号:CN110708381B

    公开(公告)日:2022-03-08

    申请号:CN201910966870.7

    申请日:2019-10-12

    Applicant: 暨南大学

    Abstract: 本发明公开基于ZigBee的智能园林讲解系统及控制方法,该讲解系统设在植物上的植物标签模块、智能讲解终端、无线网络模块和后台控制中心;后台控制中心包括北斗定位模块和数据处理SDK,数据处理SDK与北斗定位模块通过串口耦合连接,并通过北斗定位模块与无线网络模块的第一北斗定位模块无线通讯连接,第一北斗定位模块通过串口耦合连接ZigBee模块,ZigBee模块与植物标签模块的协调节点的第一ZigBee模块和智能讲解终端的第二ZigBee模块无线通讯连接,第二ZigBee模块还与第一ZigBee模块和植物标签模块的参考节点的第三ZigBee模块无线通讯连接,第二ZigBee模块还通过串口与讲解单元耦合连接。

    一种基于安全强化学习及视觉传感器的机器人避障系统

    公开(公告)号:CN113359744B

    公开(公告)日:2022-03-01

    申请号:CN202110684879.6

    申请日:2021-06-21

    Applicant: 暨南大学

    Abstract: 本发明公开了一种基于安全强化学习及视觉传感器的机器人避障系统,包括卷积神经模块,所述卷积神经网络模块包括长短期记忆单元;还包括加入LSTM单元、第一卷积层、第二卷积层、第一全连接层、第二全连接层、输出层。本发明采用强化学习算法的增强,使多维,连续,多约束问题能够较好的收敛于信任域内,解决了以往带约束的强化学习算法的诸多问题。可以大幅提高生产安全,普适地应用在不同场合的危险工作上,在解放劳动力的同时,提高了操作安全性、精准性。

    策略信息生成方法、装置、电子装置和存储介质

    公开(公告)号:CN113239639A

    公开(公告)日:2021-08-10

    申请号:CN202110728541.6

    申请日:2021-06-29

    Applicant: 暨南大学

    Abstract: 本申请涉及策略信息生成方法、装置、电子装置和存储介质,其中,该策略信息生成方法包括:从预设仿真模型中,获取对应的生产运行状态数据,其中,预设仿真模型用于表征工业生产线的运行;对生产运行状态数据进行处理,得到工业生产线的设备所对应的设备状态信息及第一动作策略信息,其中,第一动作策略信息用于指示设备按预设的运行参数进行工作;在接收到策略信息生成请求的情况下,获取工业生产线当前设备状态信息,并通过预设的强化训练模型对当前设备状态信息进行处理,生成对应的策略信息。通过本申请,解决了相关技术中对包括离散任务的生产线自动化优化配置效果差的问题,实现了利用人工智能进行各类不同生产线的优化策略。

Patent Agency Ranking