Patent search ap:("北京邮电大学") AND inv:"吴思雷" Page 1

1.

发明授权
具有远程交互功能的全息投影辅助教学方法、装置及系统有权

公开(公告)号：CN108734792B

公开(公告)日：2020-11-13

申请号：CN201810510821.8

申请日：2018-05-24

Applicant: 北京邮电大学

Inventor： 董钰舜 , 桑潮 , 陶志远 , 郑远 , 吴思雷 , 孙文生

IPC: G06T19/20 , G09B5/14 , G06Q50/20

Abstract: 本发明公开了一种具有远程交互功能的全息投影辅助教学方法、装置及系统。所述方法包括：操作数据模型进行移动，读取鼠标动作获取鼠标横纵坐标的偏移信息与点按信息；将所述鼠标横纵坐标的偏移信息与点按信息转化为所述模型图像的四个面的旋转信息；根据所述旋转信息将所述模型图像的四个面进行坐标变换，生成变换后的所述数据模型的坐标信息；将所述数据模型的坐标信息转换为屏幕显示窗口坐标信息，并对变换后的所述数据模型的四个面依次进行渲染，生成所述数据模型的全息投影。本发明创造性的提出一种能够使用户可以操作数据模型进行旋转、伸缩、移动模型等操作，实现了3D模型与用户的交互功能。

2.

发明授权
应急无人机群轨迹调控方法及相关设备有权

公开(公告)号：CN114611660B

公开(公告)日：2025-01-07

申请号：CN202210088574.3

申请日：2022-01-25

Applicant: 北京邮电大学

Inventor： 许文俊 , 吴思雷 , 王凤玉 , 袁彩霞 , 高晖 , 李国军

IPC: G06N3/0464 , G06N20/20

Abstract: 本申请提供一种应急无人机群轨迹调控方法及相关设备，应用于应急无人机通信网络系统，应急无人机通信网络系统包括多个设有基站的无人机和多个用户终端，每个基站均配置联邦强化学习智能体和经验回放样本池，每个联邦强化学习智能体均包括深度神经网络。该方法包括：构建应急无人机通信网络模型；获取基站对应的状态信息，并将状态信息输入至联邦强化学习智能体，其中，设有距离最近的基站的无人机为目标无人机；通过调取存入基站对应的经验回放样本池中的样本数据对深度神经网络进行训练，输出目标无人机当前时刻的动作信息，并根据动作信息调整目标无人机的飞行轨迹，并进入下一时刻进行飞行轨迹的调整。可以与环境实时交互，适应动态环境变化。

3.

发明授权
基于多智能体最大熵强化学习的通信覆盖方法及相关设备有权

公开(公告)号：CN115314904B

公开(公告)日：2024-03-29

申请号：CN202210674727.2

申请日：2022-06-14

Applicant: 北京邮电大学

Inventor： 许文俊 , 吴思雷 , 林兰 , 李国军 , 王凤玉 , 张天魁

IPC: H04W16/18 , H04W4/90 , H04B7/185 , G06N20/20 , G06F18/23213 , G06N3/092

Abstract: 本申请提供一种基于多智能体最大熵强化学习的灾后通信覆盖方法及相关设备。以多无人机基站混合式组网的方式为灾后用户恢复地面通信服务，提出分布式“分簇‑轨迹”分层空中覆盖优化结构，底层以分布式k‑sums算法实现高负载效率和高均衡性的大规模用户分簇，上层结合分簇结果以“分布式训练‑分布式执行”的MASAC神经网络优化多无人机基站的飞行轨迹，减小网络的通信中断概率，实现对大规模灾后用户的空中覆盖优化。在集成学习技术的辅助下，MASAC算法解决了多智能体训练环境非平稳和由确定性策略梯度引起的算法收敛稳定性较差的问题，最终实现降低应急通信网络的通信中断概率的有益效果。

4.

发明授权
多无人机3D悬停位置联合优化方法、装置和无人机基站有权

公开(公告)号：CN110531617B

公开(公告)日：2021-01-08

申请号：CN201910695765.4

申请日：2019-07-30

Applicant: 北京邮电大学

Inventor： 许文俊 , 徐越 , 吴思雷 , 冯志勇 , 张平 , 林家儒

IPC: G05B13/04 , G05B13/02 , G05D1/04 , H04W64/00 , H04W56/00

Abstract: 本发明公开了多无人机3D悬停位置联合优化方法、装置和无人机基站。该方法首先获取无人机所处的异构网络的状态信息；将状态信息输入预先构建的深度强化学习网络，通过当前策略决策下一时刻的悬停位置，并从环境中获得无人机在当前时刻的悬停位置的回报函数值；基于异策略深度确定梯度策略算法，求取更新的梯度，多个无人机同步更新策略参数；根据更新梯度，迭代执行从获取状态信息到同步更新多个无人机的策略参数的步骤，使目标策略函数逐渐收敛，直至得到最优策略。该装置包括状态获取单元、回报单元、梯度更新单元和训练单元。无人机基站，其处理器可执行本发明方法。本发明实现了多无人机在环境中自主学习，可以适应动态、非平稳的环境变化。

5.

发明授权
基于深度强化学习的无人机轨迹优化方法、装置和无人机有权

公开(公告)号：CN110488861B

公开(公告)日：2020-08-28

申请号：CN201910697007.6

申请日：2019-07-30

Applicant: 北京邮电大学

Inventor： 许文俊 , 徐越 , 吴思雷 , 张治 , 张平 , 林家儒

IPC: G05D1/10

Abstract: 本发明公开了基于深度强化学习的无人机轨迹优化方法、装置和无人机，该方法预先构建强化学习网络，在无人机飞行过程中实时产生状态数据、动作决策数据；以状态数据为输入、以所述动作决策数据为输出，以瞬时能量效率为奖励回报，利用PPO算法优化策略参数，输出最优策略。该装置包括构建模块、训练数据收集模块和训练模块。该无人机包括处理器，该处理器用于执行本发明的基于深度强化学习的无人机轨迹优化方法。本发明具备从累积的飞行数据中进行自主学习的能力，可在未知通信场景下，智能决定其最佳飞行速度、加速度、飞行方向与返航时间，归纳出能量效率最优飞行策略，具有较强的环境适应能力与泛化能力。

6.

发明公开
基于深度强化学习的无人机轨迹优化方法、装置和无人机有权

公开(公告)号：CN110488861A

公开(公告)日：2019-11-22

申请号：CN201910697007.6

申请日：2019-07-30

Applicant: 北京邮电大学

Inventor： 许文俊 , 徐越 , 吴思雷 , 张治 , 张平 , 林家儒

IPC: G05D1/10

Abstract: 本发明公开了基于深度强化学习的无人机轨迹优化方法、装置和无人机，该方法预先构建强化学习网络，在无人机飞行过程中实时产生状态数据、动作决策数据；以状态数据为输入、以所述动作决策数据为输出，以瞬时能量效率为奖励回报，利用PPO算法优化策略参数，输出最优策略。该装置包括构建模块、训练数据收集模块和训练模块。该无人机包括处理器，该处理器用于执行本发明的基于深度强化学习的无人机轨迹优化方法。本发明具备从累积的飞行数据中进行自主学习的能力，可在未知通信场景下，智能决定其最佳飞行速度、加速度、飞行方向与返航时间，归纳出能量效率最优飞行策略，具有较强的环境适应能力与泛化能力。

7.

发明公开
具有远程交互功能的全息投影辅助教学方法、装置及系统有权

公开(公告)号：CN108734792A

公开(公告)日：2018-11-02

申请号：CN201810510821.8

申请日：2018-05-24

Applicant: 北京邮电大学

Inventor： 董钰舜 , 桑潮 , 陶志远 , 郑远 , 吴思雷 , 孙文生

IPC: G06T19/20 , G09B5/14 , G06Q50/20

Abstract: 本发明公开了一种具有远程交互功能的全息投影辅助教学方法、装置及系统。所述方法包括：操作数据模型进行移动，读取鼠标动作获取鼠标横纵坐标的偏移信息与点按信息；将所述鼠标横纵坐标的偏移信息与点按信息转化为所述模型图像的四个面的旋转信息；根据所述旋转信息将所述模型图像的四个面进行坐标变换，生成变换后的所述数据模型的坐标信息；将所述数据模型的坐标信息转换为屏幕显示窗口坐标信息，并对变换后的所述数据模型的四个面依次进行渲染，生成所述数据模型的全息投影。本发明创造性的提出一种能够使用户可以操作数据模型进行旋转、伸缩、移动模型等操作，实现了3D模型与用户的交互功能。

8.

发明公开
基于多智能体最大熵强化学习的通信覆盖方法及相关设备有权

公开(公告)号：CN115314904A

公开(公告)日：2022-11-08

申请号：CN202210674727.2

申请日：2022-06-14

Applicant: 北京邮电大学

Inventor： 许文俊 , 吴思雷 , 林兰 , 李国军 , 王凤玉 , 张天魁

IPC: H04W16/18 , H04W4/90 , H04B7/185 , G06N20/20 , G06K9/62

Abstract: 本申请提供一种基于多智能体最大熵强化学习的灾后通信覆盖方法及相关设备。以多无人机基站混合式组网的方式为灾后用户恢复地面通信服务，提出分布式“分簇‑轨迹”分层空中覆盖优化结构，底层以分布式k‑sums算法实现高负载效率和高均衡性的大规模用户分簇，上层结合分簇结果以“分布式训练‑分布式执行”的MASAC神经网络优化多无人机基站的飞行轨迹，减小网络的通信中断概率，实现对大规模灾后用户的空中覆盖优化。在集成学习技术的辅助下，MASAC算法解决了多智能体训练环境非平稳和由确定性策略梯度引起的算法收敛稳定性较差的问题，最终实现降低应急通信网络的通信中断概率的有益效果。

9.

发明公开
多无人机3D悬停位置联合优化方法、装置和无人机基站有权

公开(公告)号：CN110531617A

公开(公告)日：2019-12-03

申请号：CN201910695765.4

申请日：2019-07-30

Applicant: 北京邮电大学

Inventor： 许文俊 , 徐越 , 吴思雷 , 冯志勇 , 张平 , 林家儒

IPC: G05B13/04 , G05B13/02 , G05D1/04 , H04W64/00 , H04W56/00

Abstract: 本发明公开了多无人机3D悬停位置联合优化方法、装置和无人机基站。该方法首先获取无人机所处的异构网络的状态信息；将状态信息输入预先构建的深度强化学习网络，通过当前策略决策下一时刻的悬停位置，并从环境中获得无人机在当前时刻的悬停位置的回报函数值；基于异策略深度确定梯度策略算法，求取更新的梯度，多个无人机同步更新策略参数；根据更新梯度，迭代执行从获取状态信息到同步更新多个无人机的策略参数的步骤，使目标策略函数逐渐收敛，直至得到最优策略。该装置包括状态获取单元、回报单元、梯度更新单元和训练单元。无人机基站，其处理器可执行本发明方法。本发明实现了多无人机在环境中自主学习，可以适应动态、非平稳的环境变化。

10.

发明公开
应急无人机群轨迹调控方法及相关设备有权

公开(公告)号：CN114611660A

公开(公告)日：2022-06-10

申请号：CN202210088574.3

申请日：2022-01-25

Applicant: 北京邮电大学

Inventor： 许文俊 , 吴思雷 , 王凤玉 , 袁彩霞 , 高晖 , 李国军

IPC: G06N3/04 , G06N20/20

Abstract: 本申请提供一种应急无人机群轨迹调控方法及相关设备，应用于应急无人机通信网络系统，应急无人机通信网络系统包括多个设有基站的无人机和多个用户终端，每个基站均配置联邦强化学习智能体和经验回放样本池，每个联邦强化学习智能体均包括深度神经网络。该方法包括：构建应急无人机通信网络模型；获取基站对应的状态信息，并将状态信息输入至联邦强化学习智能体，其中，设有距离最近的基站的无人机为目标无人机；通过调取存入基站对应的经验回放样本池中的样本数据对深度神经网络进行训练，输出目标无人机当前时刻的动作信息，并根据动作信息调整目标无人机的飞行轨迹，并进入下一时刻进行飞行轨迹的调整。可以与环境实时交互，适应动态环境变化。

Search Results

Country/Region

Patent validity

Application date

Publication (announcement) day

applicant

The country/region where the applicant is located

Inventor

IPC

IPC Department

IPC class

IPC subclass

IPC group

IPC team

Appearance classification