Patent search ap:("北京科技大学") AND inv:"闫昊琪" Page 2

11.

发明授权
一种强化学习型液压机械臂集成控制方法及装置有权

公开(公告)号：CN115781696B

公开(公告)日：2023-04-25

申请号：CN202310063392.5

申请日：2023-01-18

Applicant: 北京科技大学

Inventor： 段京良 , 闫昊琪 , 马飞 , 高路路 , 曹星宇 , 许皓渊 , 陈良发 , 肖礼明 , 焦春绚

IPC: B25J9/16

Abstract: 本发明公开了一种强化学习型液压机械臂集成控制方法及装置，涉及工业机械臂控制技术领域。包括：获取待控制的液压机械臂的当前位姿与目标位姿；根据当前位姿与目标位姿，计算得到位姿差距；将位姿差距输入到构建好的基于强化学习的控制策略模型；根据位姿差距以及基于强化学习的控制策略模型，完成液压机械臂的控制任务。本发明基于约束型强化学习，在液压机械臂与环境交互的过程中，通过探索试错的方式实现机械臂控制策略的自学习。本发明适用于液压机械臂智能作业过程，通过控制各个关节同时执行动作，实现了一种集成式控制的功能，在保证作业安全性的前提下有效提升了液压机械臂的工作效率。

12.

发明公开
自动驾驶车辆的权重系数和控制策略自学习方法及装置有权

公开(公告)号：CN115626184A

公开(公告)日：2023-01-20

申请号：CN202211629437.2

申请日：2022-12-19

Applicant: 北京科技大学

Inventor： 段京良 , 张发旺 , 马飞 , 陈良发 , 焦春绚 , 闫昊琪 , 曹星宇 , 许皓渊 , 肖礼明

IPC: B60W60/00 , B60W50/00

Abstract: 本发明公开了一种自动驾驶车辆的权重系数和控制策略自学习方法及装置，涉及车辆自动驾驶控制技术领域。包括：获取待优化的控制策略；将待优化的控制策略输入到构建好的控制策略双层优化模型；其中，控制策略双层优化模型包括权重系数优化层以及控制策略优化层；根据待优化的控制策略、权重系数优化层以及控制策略优化层，得到优化后的控制策略，基于优化后的控制策略对自动驾驶车辆进行控制。本发明基于给定的专家驾驶策略，通过模仿该目标控制策略实现控制代价函数权重系数和控制策略的自学习。本发明能够解决在控制自动驾驶车辆时，为了实现良好的控制性能而面临的不断调整代价函数的权重系数，且该方法能够实现控制策略的自提升。

Patent Agency Ranking