Patent search ap:("哈尔滨工业大学(深圳)") AND inv:"李衍杰" Page 2

11.

发明授权
一种基于深度安全强化学习的机器人无地图导航方法有权

公开(公告)号：CN113093727B

公开(公告)日：2023-03-28

申请号：CN202110250387.6

申请日：2021-03-08

Applicant: 哈尔滨工业大学(深圳)

Inventor： 吕少华 , 李衍杰 , 许运鸿 , 刘奇 , 陈美玲 , 赵威龙 , 刘悦丞 , 庞玺政

IPC: G05D1/02

Abstract: 本发明具体涉及一种基于深度安全强化学习的机器人无地图导航方法，具体包括：初始化训练环境，设计移动机器人奖励函数和安全风险代价函数；利用传感器检测的图像信息和激光雷达信息，结合移动机器人的目标信息和运动信息，将各状态信息进行处理后经Actor网络输出决策动作到机器人，机器人执行Actor网络输出的动作，从环境中得到下一时刻新的状态观测及奖励信息，将机器人与环境交互得到的经验存入经验池，定期更新网络参数；判断是否训练结束，将训练好的模型应用于真实移动机器人进行导航。本发明基于演员‑评论家‑安全（ACS）框架的深度安全强化学习，通过引入约束性策略优化（CPO）算法，提升了强化学习用于无地图导航任务的安全性。

12.

发明公开
基于仓储环境的多智能通信强化学习体路径规划方法及系统审中-实审

公开(公告)号：CN115496287A

公开(公告)日：2022-12-20

申请号：CN202211179911.6

申请日：2022-11-15

Applicant: 哈尔滨工业大学(深圳)

Inventor： 叶兆晖 , 李衍杰 , 庞玺政 , 付文 , 卢颂硕 , 邓琦 , 牟涌金

IPC: G06Q10/04 , G06Q10/08 , G06N3/08

Abstract: 本发明涉及一种基于仓储环境的多智能通信强化学习体路径规划方法和系统。其中的方法包括：生成地图，获取智能体的起始点、目标点和障碍物信息并输入至神经网络，通过观测值处理模块获得智能体的自身特征，采用基于贪心的优先级对智能体进行分配，基于邻接矩阵并根据分配的优先级为每个智能体挑选邻居智能体，每个智能体接收各自挑选出的邻居智能体的通信消息并形成邻居特征，根据邻居特征与自身特征形成最终特征，将最终特征输入到决策网络模块中以生成规划路径。本发明引入通信来缓解强化学习导致的环境不平稳性，通过优先级选取通信智能体以提高有效性，引入一个新的死锁检测机制使得智能体可跳出死锁。

13.

发明公开
基于大批量单件重复加工的智能速度规划方法无效

公开(公告)号：CN107765647A

公开(公告)日：2018-03-06

申请号：CN201710851082.4

申请日：2017-09-20

Applicant: 哈尔滨工业大学深圳研究生院

Inventor： 李建刚 , 宋恺 , 李衍杰 , 楼云江

IPC: G05B19/416

Abstract: 本发明提供了一种基于大批量单件重复加工的智能速度规划方法，包括以下步骤：S1、机床加工；S2、多传感器采集信号；S3、特征提取，信号融合；S4、切削状态判断，从样本库导入样本，将样本与提取到的特征信号进行比较，如果正常，则进入下一步骤，如果重切削或者轻切削，则进行速度修正并进入下一步骤；S5、单次加工结束，得到规划速度；S6、重复步骤S1至S5得到最优规划速度。本发明的有益效果是：提高了加工效率和加工精度。

14.

发明公开
一种针对大尺度环境的多机器人协同制图与定位的方法无效

公开(公告)号：CN106272423A

公开(公告)日：2017-01-04

申请号：CN201610799842.7

申请日：2016-08-31

Applicant: 哈尔滨工业大学深圳研究生院

Inventor： 陈浩耀 , 秦野 , 李衍杰 , 楼云江 , 李兵 , 刘云辉

IPC: B25J9/16

CPC classification number: B25J9/1664 , B25J9/1697

Abstract: 本发明提出了一种针对大尺度环境的多机器人协同制图与定位的方法，包括基于视觉检测闭环的单机器人激光SLAM算法、多机器人位姿约束估计算法以及多机器人地图融合算法；其中，基于视觉检测闭环的单机器人激光SLAM算法利用视觉传感器来辅助激光传感器，实现更为稳定鲁棒性的SLAM算法。本发明通过激光和视觉传感器实现了多机器人的同步定位与制图。通过摄像头获得鲁棒的视觉特征来检测闭环，有效地解决了机器人运动累积误差所造成的闭环检测难题，同时通过多机器人系统，高效率地完成大区域环境下的同步定位与制图，克服了单机器人效率低的缺点。本发明的方法在大尺度环境下实现准确的机器人定位和环境的地图创建，同样适用于小尺度环境。

15.

发明公开
一种针对服务机器人的高维操作臂遥操作方法有权转让

公开(公告)号：CN104057450A

公开(公告)日：2014-09-24

申请号：CN201410279982.2

申请日：2014-06-20

Applicant: 哈尔滨工业大学深圳研究生院

Inventor： 陈浩耀 , 楼云江 , 李衍杰

IPC: B25J9/16 , G05B19/418

CPC classification number: Y02P90/02 , B25J9/1664

Abstract: 本发明提供了一种针对服务机器人的高维操作臂遥操作方法，包括手势识别器、沉浸式虚拟3D眼镜、带路由器的嵌入式处理器和服务机器人；机械臂采用自主运动规划方法，这一规划方法是由远端服务机器人自主运行，这个自主规划方法是一种基于采样的路径规划方法。本发明可以实时的控制并且以第一视角体验远端服务机器人手臂的运动，机器人自身能够根据其真实环境做出自主的规划出可行的运动路径。该发明不仅可以应用于家庭服务机器人，还可以在工业机器人以及工业虚拟制造领域，都有非常广泛的应用价值。

16.

发明公开
一种动态电源管理方法失效

公开(公告)号：CN103823544A

公开(公告)日：2014-05-28

申请号：CN201410073638.8

申请日：2014-03-03

Applicant: 哈尔滨工业大学深圳研究生院

Inventor： 李衍杰 , 王辉静

IPC: G06F1/32

Abstract: 本发明公开了一种动态电源管理方法。本发明采用了在线估计技术，通过记录被控对象的运行轨迹，实时学习估算出系统功耗和性能关于管理策略参数的梯度信息，通过梯度信息自适应地调整管理策略，从而实现了电源管理策略基于系统运行轨迹的实时自适应调整，最终实现个性化的动态电源管理。

17.

发明授权
一种无人机及其基于视觉的抓取方法有权

公开(公告)号：CN107139178B

公开(公告)日：2024-02-23

申请号：CN201710326701.8

申请日：2017-05-10

Applicant: 哈尔滨工业大学深圳研究生院

Inventor： 陈浩耀 , 方林旭 , 楼云江 , 李衍杰 , 刘云辉

IPC: B25J11/00 , B25J9/16 , B64D1/22

Abstract: 本发明提供了一种无人机，包括无人机机体、机械臂、舵机控制关节和摄像头，所述机械臂固连于所述无人机机体的下方，所述舵机控制关节连接于所述无人机机体的上方前部，所述舵机控制关节为单自由度，所述舵机控制关节与所述摄像头连接，所述无人机机体上贴有运动捕捉系统的第一定位标签，所述舵机控制关节、摄像头之间贴有运动捕捉系统的第二定位标签。本发明还提供了一种无人机基于视觉的抓取方法。本发明的有益效果是：实现了无人机机械臂的伺服抓取，具有低成本，高精度的特点，极具应用价值。

18.

发明授权
一种带有柔性抓取器的飞行机械臂有权

公开(公告)号：CN106985159B

公开(公告)日：2023-07-07

申请号：CN201710327674.6

申请日：2017-05-10

Applicant: 哈尔滨工业大学深圳研究生院

Inventor： 陈浩耀 , 全凤宇 , 楼云江 , 李衍杰 , 刘云辉

IPC: B25J15/12 , B25J18/00 , B64D1/22

Abstract: 本发明提供了一种带有柔性抓取器的飞行机械臂，包括多旋翼飞行器、多自由度机械臂和柔性抓取器，所述多旋翼飞行器与所述多自由度机械臂连接，所述多自由度机械臂与所述柔性抓取器连接。本发明的有益效果是：通过在多旋翼飞行器下挂载多自由度机械臂，利用多旋翼飞行器能够快速移动的特性，提高了多自由度机械臂的实用能力。同时，利用柔性抓取器作为多自由度机械臂的末端，能够很好的适应抓取物外形，从而大大提高了抓取任务的成功率。

19.

发明授权
基于注意力模型和深度强化学习的无人车行驶决策方法有权

公开(公告)号：CN112965499B

公开(公告)日：2022-11-01

申请号：CN202110251268.2

申请日：2021-03-08

Applicant: 哈尔滨工业大学(深圳)

Inventor： 陈美玲 , 李衍杰 , 刘奇 , 吕少华 , 许运鸿 , 刘悦丞

IPC: G05D1/02

Abstract: 本发明公开了一种基于注意力模型和深度强化学习的无人车行驶决策方法通过构建感知模块和决策模块完成无人车行驶决策任务，具体为：通过搭建自注意力模型和长短时记忆网络对感知模块进行建模，然后通过自动编码器模型对感知模块进行训练；利用卷积网络和全连接网络搭建决策模块，所述决策模块基于深度确定性策略算法。利用感知模块对观测数据进行降维，再利用深度强化学习决策模块进行策略学习，并通过引入优先经验回放的方法，提高数据样本的利用率，从而提高算法的训练速度。本发明方法通过在自动驾驶环境中进行模型训练后，可以在复杂的道路环境中安全行驶，并根据环境的变化制定合理的驾驶策略。

20.

发明公开
一种密集行人环境下强化学习移动机器人的导航方法及装置无效

公开(公告)号：CN113096161A

公开(公告)日：2021-07-09

申请号：CN202110353618.6

申请日：2021-03-31

Applicant: 哈尔滨工业大学(深圳)

Inventor： 刘奇 , 李衍杰 , 牟涌金 , 许运鸿 , 刘悦丞 , 高建琦

IPC: G06T7/277 , G06K9/00 , G06N3/04 , G06N20/20 , G01C21/20 , G01C21/00

Abstract: 本发明公开了一种基于空间‑时间图注意力神经网络的密集行人环境下强化学习移动机器人的导航方法，首先使用了三维多物体跟踪JRMOT技术进行2D和3D的行人轨迹追踪技术，对行人的位置进行实时追踪，在让机器人使用空间‑时间图注意力STGAT模型，根据行人历史轨迹预测未来轨迹，当机器人在行人环境中有了各个行人的轨迹后，再使用蒙特卡洛树搜索和价值估计网络，做出最优决策，进行导航任务。本发明能够在密集行人环境下快速做出避障决策，拓展了移动机器人的应用场景。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification