Patent search ap:("北京邮电大学") AND inv:"聂凌云" Page 1

1.

发明公开
基于强化学习和数字孪生的拥挤缓解策略确定方法及装置有权

公开(公告)号：CN115062926A

公开(公告)日：2022-09-16

申请号：CN202210605848.1

申请日：2022-05-30

Applicant: 北京邮电大学

Inventor： 胡铮 , 张春红 , 聂凌云 , 温志刚 , 张宸宇

IPC: G06Q10/06 , G06Q30/02 , G06F30/27 , G06N20/00

Abstract: 本发明提供一种基于强化学习和数字孪生的拥挤缓解策略确定方法及装置，该方法包括：在基于数字孪生构建的虚拟仿真环境中，将目标范围内每个区域的人流数据输入至目标智能体模型，得到当前时刻的目标动作集合，所述目标动作集合为所述目标智能体模型输出的所述当前时刻的最优动作序列；基于所述目标动作集合，得到最优拥挤缓解策略，所述最优拥挤缓解策略为使得所述每个区域的平均拥挤度达到最小的策略。本发明提供的基于强化学习和数字孪生的拥挤缓解策略确定方法及装置，可以快速获取最优拥挤缓解策略，从而可以降低各区域人群的拥挤程度。

2.

发明授权
基于强化学习和数字孪生的拥挤缓解策略确定方法及装置有权

公开(公告)号：CN115062926B

公开(公告)日：2025-03-04

申请号：CN202210605848.1

申请日：2022-05-30

Applicant: 北京邮电大学

Inventor： 胡铮 , 张春红 , 聂凌云 , 温志刚 , 张宸宇

IPC: G06Q10/0637 , G06Q30/0238 , G06F30/27 , G06N20/00

Abstract: 本发明提供一种基于强化学习和数字孪生的拥挤缓解策略确定方法及装置，该方法包括：在基于数字孪生构建的虚拟仿真环境中，将目标范围内每个区域的人流数据输入至目标智能体模型，得到当前时刻的目标动作集合，所述目标动作集合为所述目标智能体模型输出的所述当前时刻的最优动作序列；基于所述目标动作集合，得到最优拥挤缓解策略，所述最优拥挤缓解策略为使得所述每个区域的平均拥挤度达到最小的策略。本发明提供的基于强化学习和数字孪生的拥挤缓解策略确定方法及装置，可以快速获取最优拥挤缓解策略，从而可以降低各区域人群的拥挤程度。

Patent Agency Ranking